mirror of
https://github.com/MillironX/nf-core_modules.git
synced 2025-01-18 02:46:13 -05:00
Merge branch 'master' into kat_hist
This commit is contained in:
commit
1e55ad987f
22 changed files with 983 additions and 23 deletions
84
modules/busco/main.nf
Normal file
84
modules/busco/main.nf
Normal file
|
@ -0,0 +1,84 @@
|
||||||
|
process BUSCO {
|
||||||
|
tag "$meta.id"
|
||||||
|
label 'process_medium'
|
||||||
|
|
||||||
|
conda (params.enable_conda ? "bioconda::busco=5.3.2" : null)
|
||||||
|
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
||||||
|
'https://depot.galaxyproject.org/singularity/busco:5.3.2--pyhdfd78af_0':
|
||||||
|
'quay.io/biocontainers/busco:5.3.2--pyhdfd78af_0' }"
|
||||||
|
|
||||||
|
input:
|
||||||
|
tuple val(meta), path('tmp_input/*')
|
||||||
|
each lineage // Required: lineage to check against, "auto" enables --auto-lineage instead
|
||||||
|
path busco_lineages_path // Recommended: path to busco lineages - downloads if not set
|
||||||
|
path config_file // Optional: busco configuration file
|
||||||
|
|
||||||
|
output:
|
||||||
|
tuple val(meta), path("*-busco.batch_summary.txt"), emit: batch_summary
|
||||||
|
tuple val(meta), path("short_summary.*.txt") , emit: short_summaries_txt, optional: true
|
||||||
|
tuple val(meta), path("short_summary.*.json") , emit: short_summaries_json, optional: true
|
||||||
|
tuple val(meta), path("*-busco") , emit: busco_dir
|
||||||
|
path "versions.yml" , emit: versions
|
||||||
|
|
||||||
|
when:
|
||||||
|
task.ext.when == null || task.ext.when
|
||||||
|
|
||||||
|
script:
|
||||||
|
def args = task.ext.args ?: ''
|
||||||
|
def prefix = task.ext.prefix ?: "${meta.id}-${lineage}"
|
||||||
|
def busco_config = config_file ? "--config $config_file" : ''
|
||||||
|
def busco_lineage = lineage.equals('auto') ? '--auto-lineage' : "--lineage_dataset ${lineage}"
|
||||||
|
def busco_lineage_dir = busco_lineages_path ? "--offline --download_path ${busco_lineages_path}" : ''
|
||||||
|
"""
|
||||||
|
# Nextflow changes the container --entrypoint to /bin/bash (container default entrypoint: /usr/local/env-execute)
|
||||||
|
# Check for container variable initialisation script and source it.
|
||||||
|
if [ -f "/usr/local/env-activate.sh" ]; then
|
||||||
|
set +u # Otherwise, errors out because of various unbound variables
|
||||||
|
. "/usr/local/env-activate.sh"
|
||||||
|
set -u
|
||||||
|
fi
|
||||||
|
|
||||||
|
# If the augustus config directory is not writable, then copy to writeable area
|
||||||
|
if [ ! -w "\${AUGUSTUS_CONFIG_PATH}" ]; then
|
||||||
|
# Create writable tmp directory for augustus
|
||||||
|
AUG_CONF_DIR=\$( mktemp -d -p \$PWD )
|
||||||
|
cp -r \$AUGUSTUS_CONFIG_PATH/* \$AUG_CONF_DIR
|
||||||
|
export AUGUSTUS_CONFIG_PATH=\$AUG_CONF_DIR
|
||||||
|
echo "New AUGUSTUS_CONFIG_PATH=\${AUGUSTUS_CONFIG_PATH}"
|
||||||
|
fi
|
||||||
|
|
||||||
|
# Ensure the input is uncompressed
|
||||||
|
INPUT_SEQS=input_seqs
|
||||||
|
mkdir "\$INPUT_SEQS"
|
||||||
|
cd "\$INPUT_SEQS"
|
||||||
|
for FASTA in ../tmp_input/*; do
|
||||||
|
if [ "\${FASTA##*.}" == 'gz' ]; then
|
||||||
|
gzip -cdf "\$FASTA" > \$( basename "\$FASTA" .gz )
|
||||||
|
else
|
||||||
|
ln -s "\$FASTA" .
|
||||||
|
fi
|
||||||
|
done
|
||||||
|
cd ..
|
||||||
|
|
||||||
|
busco \\
|
||||||
|
--cpu $task.cpus \\
|
||||||
|
--in "\$INPUT_SEQS" \\
|
||||||
|
--out ${prefix}-busco \\
|
||||||
|
$busco_lineage \\
|
||||||
|
$busco_lineage_dir \\
|
||||||
|
$busco_config \\
|
||||||
|
$args
|
||||||
|
|
||||||
|
# clean up
|
||||||
|
rm -rf "\$INPUT_SEQS"
|
||||||
|
|
||||||
|
# Move files to avoid staging/publishing issues
|
||||||
|
mv ${prefix}-busco/batch_summary.txt ${prefix}-busco.batch_summary.txt
|
||||||
|
mv ${prefix}-busco/*/short_summary.*.{json,txt} . || echo "Short summaries were not available: No genes were found."
|
||||||
|
|
||||||
|
cat <<-END_VERSIONS > versions.yml
|
||||||
|
"${task.process}":
|
||||||
|
busco: \$( busco --version 2>&1 | sed 's/^BUSCO //' )
|
||||||
|
END_VERSIONS
|
||||||
|
"""
|
||||||
|
}
|
69
modules/busco/meta.yml
Normal file
69
modules/busco/meta.yml
Normal file
|
@ -0,0 +1,69 @@
|
||||||
|
name: busco
|
||||||
|
description: Benchmarking Universal Single Copy Orthologs
|
||||||
|
keywords:
|
||||||
|
- quality control
|
||||||
|
- genome
|
||||||
|
- transcriptome
|
||||||
|
- proteome
|
||||||
|
tools:
|
||||||
|
- busco:
|
||||||
|
description: BUSCO provides measures for quantitative assessment of genome assembly, gene set, and transcriptome completeness based on evolutionarily informed expectations of gene content from near-universal single-copy orthologs selected from OrthoDB.
|
||||||
|
homepage: https://busco.ezlab.org/
|
||||||
|
documentation: https://busco.ezlab.org/busco_userguide.html
|
||||||
|
tool_dev_url: https://gitlab.com/ezlab/busco
|
||||||
|
doi: "10.1007/978-1-4939-9173-0_14"
|
||||||
|
licence: ["MIT"]
|
||||||
|
|
||||||
|
input:
|
||||||
|
- meta:
|
||||||
|
type: map
|
||||||
|
description: |
|
||||||
|
Groovy Map containing sample information
|
||||||
|
e.g. [ id:'test', single_end:false ]
|
||||||
|
- fasta:
|
||||||
|
type: file
|
||||||
|
description: Nucleic or amino acid sequence file in FASTA format.
|
||||||
|
pattern: "*.{fasta,fna,fa,fasta.gz,fna.gz,fa.gz}"
|
||||||
|
- lineage:
|
||||||
|
type: value
|
||||||
|
description: The BUSCO lineage to use, or "auto" to automatically select lineage
|
||||||
|
- busco_lineages_path:
|
||||||
|
type: directory
|
||||||
|
description: Path to local BUSCO lineages directory.
|
||||||
|
- config_file:
|
||||||
|
type: file
|
||||||
|
description: Path to BUSCO config file.
|
||||||
|
|
||||||
|
output:
|
||||||
|
- meta:
|
||||||
|
type: map
|
||||||
|
description: |
|
||||||
|
Groovy Map containing sample information
|
||||||
|
e.g. [ id:'test', single_end:false ]
|
||||||
|
- batch_summary:
|
||||||
|
type: file
|
||||||
|
description: Summary of all sequence files analyzed
|
||||||
|
pattern: "*-busco.batch_summary.txt"
|
||||||
|
- short_summaries_txt:
|
||||||
|
type: file
|
||||||
|
description: Short Busco summary in plain text format
|
||||||
|
pattern: "short_summary.*.txt"
|
||||||
|
- short_summaries_json:
|
||||||
|
type: file
|
||||||
|
description: Short Busco summary in JSON format
|
||||||
|
pattern: "short_summary.*.json"
|
||||||
|
- busco_dir:
|
||||||
|
type: directory
|
||||||
|
description: BUSCO lineage specific output
|
||||||
|
pattern: "*-busco"
|
||||||
|
- versions:
|
||||||
|
type: file
|
||||||
|
description: File containing software versions
|
||||||
|
pattern: "versions.yml"
|
||||||
|
|
||||||
|
authors:
|
||||||
|
- "@priyanka-surana"
|
||||||
|
- "@charles-plessy"
|
||||||
|
- "@mahesh-panchal"
|
||||||
|
- "@muffato"
|
||||||
|
- "@jvhagey"
|
|
@ -20,7 +20,6 @@ process CNVPYTOR_CALLCNVS {
|
||||||
|
|
||||||
script:
|
script:
|
||||||
def bins = bin_sizes ?: '1000'
|
def bins = bin_sizes ?: '1000'
|
||||||
def prefix = task.ext.prefix ?: "${meta.id}"
|
|
||||||
"""
|
"""
|
||||||
cnvpytor \\
|
cnvpytor \\
|
||||||
-root $pytor \\
|
-root $pytor \\
|
||||||
|
|
|
@ -8,7 +8,7 @@ process CNVPYTOR_VIEW {
|
||||||
'quay.io/biocontainers/cnvpytor:1.2.1--pyhdfd78af_0' }"
|
'quay.io/biocontainers/cnvpytor:1.2.1--pyhdfd78af_0' }"
|
||||||
|
|
||||||
input:
|
input:
|
||||||
tuple val(meta), path(pytor)
|
tuple val(meta), path(pytor_files)
|
||||||
val bin_sizes
|
val bin_sizes
|
||||||
val output_format
|
val output_format
|
||||||
|
|
||||||
|
@ -23,17 +23,18 @@ process CNVPYTOR_VIEW {
|
||||||
|
|
||||||
script:
|
script:
|
||||||
def output_suffix = output_format ?: 'vcf'
|
def output_suffix = output_format ?: 'vcf'
|
||||||
def bins = bin_sizes ?: '1000'
|
def bins = bin_sizes ?: '1000'
|
||||||
|
def input = pytor_files.join(" ")
|
||||||
|
def prefix = task.ext.prefix ?: "${meta.id}"
|
||||||
"""
|
"""
|
||||||
|
|
||||||
python3 <<CODE
|
python3 <<CODE
|
||||||
import cnvpytor,os
|
import cnvpytor,os
|
||||||
from pathlib import Path
|
|
||||||
pytor_file = Path("$pytor")
|
|
||||||
binsizes = "${bins}".split(" ")
|
binsizes = "${bins}".split(" ")
|
||||||
for binsize in binsizes:
|
for binsize in binsizes:
|
||||||
app = cnvpytor.Viewer(["$pytor"], params={} )
|
file_list = "${input}".split(" ")
|
||||||
outputfile = "{}_{}.{}".format(pytor_file.stem,binsize.strip(),"${output_suffix}")
|
app = cnvpytor.Viewer(file_list, params={} )
|
||||||
|
outputfile = "{}_{}.{}".format("${prefix}",binsize.strip(),"${output_suffix}")
|
||||||
app.print_filename = outputfile
|
app.print_filename = outputfile
|
||||||
app.bin_size = int(binsize)
|
app.bin_size = int(binsize)
|
||||||
app.print_calls_file()
|
app.print_calls_file()
|
||||||
|
@ -47,8 +48,9 @@ process CNVPYTOR_VIEW {
|
||||||
|
|
||||||
stub:
|
stub:
|
||||||
def output_suffix = output_format ?: 'vcf'
|
def output_suffix = output_format ?: 'vcf'
|
||||||
|
def prefix = task.ext.prefix ?: "${meta.id}"
|
||||||
"""
|
"""
|
||||||
touch ${pytor.baseName}.${output_suffix}
|
touch ${prefix}.${output_suffix}
|
||||||
|
|
||||||
cat <<-END_VERSIONS > versions.yml
|
cat <<-END_VERSIONS > versions.yml
|
||||||
"${task.process}":
|
"${task.process}":
|
||||||
|
|
|
@ -17,9 +17,9 @@ input:
|
||||||
description: |
|
description: |
|
||||||
Groovy Map containing sample information
|
Groovy Map containing sample information
|
||||||
e.g. [ id:'test' ]
|
e.g. [ id:'test' ]
|
||||||
- pytor:
|
- pytor_files:
|
||||||
type: file
|
type: file
|
||||||
description: pytor file containing read depth data
|
description: pytor file containing cnv calls. To merge calls from multiple samples use a list of files.
|
||||||
pattern: "*.{pytor}"
|
pattern: "*.{pytor}"
|
||||||
- bin_sizes:
|
- bin_sizes:
|
||||||
type: string
|
type: string
|
||||||
|
|
35
modules/md5sum/main.nf
Normal file
35
modules/md5sum/main.nf
Normal file
|
@ -0,0 +1,35 @@
|
||||||
|
process MD5SUM {
|
||||||
|
tag "$meta.id"
|
||||||
|
label 'process_low'
|
||||||
|
|
||||||
|
conda (params.enable_conda ? "conda-forge::coreutils=9.1" : null)
|
||||||
|
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
||||||
|
'https://depot.galaxyproject.org/singularity/ubuntu:20.04' :
|
||||||
|
'ubuntu:20.04' }"
|
||||||
|
|
||||||
|
input:
|
||||||
|
tuple val(meta), path(file)
|
||||||
|
|
||||||
|
output:
|
||||||
|
tuple val(meta), path("*.md5"), emit: checksum
|
||||||
|
path "versions.yml" , emit: versions
|
||||||
|
|
||||||
|
when:
|
||||||
|
task.ext.when == null || task.ext.when
|
||||||
|
|
||||||
|
script:
|
||||||
|
def args = task.ext.args ?: ''
|
||||||
|
def prefix = task.ext.prefix ?: "${meta.id}"
|
||||||
|
|
||||||
|
"""
|
||||||
|
md5sum \\
|
||||||
|
$args \\
|
||||||
|
${file} \\
|
||||||
|
> ${file}.md5
|
||||||
|
|
||||||
|
cat <<-END_VERSIONS > versions.yml
|
||||||
|
"${task.process}":
|
||||||
|
md5sum: \$(echo \$(md5sum --version 2>&1 | head -n 1| sed 's/^.*) //;' ))
|
||||||
|
END_VERSIONS
|
||||||
|
"""
|
||||||
|
}
|
39
modules/md5sum/meta.yml
Normal file
39
modules/md5sum/meta.yml
Normal file
|
@ -0,0 +1,39 @@
|
||||||
|
name: "md5sum"
|
||||||
|
description: Create an MD5 (128-bit) checksum
|
||||||
|
keywords:
|
||||||
|
- checksum
|
||||||
|
tools:
|
||||||
|
- "md5sum":
|
||||||
|
description: Create an MD5 (128-bit) checksum
|
||||||
|
homepage: "https://www.gnu.org"
|
||||||
|
documentation: "https://man7.org/linux/man-pages/man1/md5sum.1.html"
|
||||||
|
licence: GPLv3+
|
||||||
|
|
||||||
|
input:
|
||||||
|
- meta:
|
||||||
|
type: map
|
||||||
|
description: |
|
||||||
|
Groovy Map containing sample information
|
||||||
|
e.g. [ id:'test', single_end:false ]
|
||||||
|
- file:
|
||||||
|
type: file
|
||||||
|
description: Any file
|
||||||
|
pattern: "*.*"
|
||||||
|
|
||||||
|
output:
|
||||||
|
- meta:
|
||||||
|
type: map
|
||||||
|
description: |
|
||||||
|
Groovy Map containing sample information
|
||||||
|
e.g. [ id:'test', single_end:false ]
|
||||||
|
- versions:
|
||||||
|
type: file
|
||||||
|
description: File containing software versions
|
||||||
|
pattern: "versions.yml"
|
||||||
|
- checksum:
|
||||||
|
type: file
|
||||||
|
description: File containing checksum
|
||||||
|
pattern: "*.md5"
|
||||||
|
|
||||||
|
authors:
|
||||||
|
- "@matthdsm"
|
35
modules/shasum/main.nf
Normal file
35
modules/shasum/main.nf
Normal file
|
@ -0,0 +1,35 @@
|
||||||
|
process SHASUM {
|
||||||
|
tag "$meta.id"
|
||||||
|
label 'process_low'
|
||||||
|
|
||||||
|
conda (params.enable_conda ? "conda-forge::coreutils=9.1" : null)
|
||||||
|
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
||||||
|
'https://depot.galaxyproject.org/singularity/ubuntu:20.04' :
|
||||||
|
'ubuntu:20.04' }"
|
||||||
|
|
||||||
|
input:
|
||||||
|
tuple val(meta), path(file)
|
||||||
|
|
||||||
|
output:
|
||||||
|
tuple val(meta), path("*.sha256"), emit: checksum
|
||||||
|
path "versions.yml" , emit: versions
|
||||||
|
|
||||||
|
when:
|
||||||
|
task.ext.when == null || task.ext.when
|
||||||
|
|
||||||
|
script:
|
||||||
|
def args = task.ext.args ?: ''
|
||||||
|
def prefix = task.ext.prefix ?: "${meta.id}"
|
||||||
|
|
||||||
|
"""
|
||||||
|
sha256sum \\
|
||||||
|
$args \\
|
||||||
|
${file} \\
|
||||||
|
> ${file}.sha256
|
||||||
|
|
||||||
|
cat <<-END_VERSIONS > versions.yml
|
||||||
|
"${task.process}":
|
||||||
|
sha256sum: \$(echo \$(sha256sum --version 2>&1 | head -n 1| sed 's/^.*) //;' ))
|
||||||
|
END_VERSIONS
|
||||||
|
"""
|
||||||
|
}
|
40
modules/shasum/meta.yml
Normal file
40
modules/shasum/meta.yml
Normal file
|
@ -0,0 +1,40 @@
|
||||||
|
name: "shasum"
|
||||||
|
description: Print SHA256 (256-bit) checksums.
|
||||||
|
keywords:
|
||||||
|
- checksum
|
||||||
|
- sha256
|
||||||
|
tools:
|
||||||
|
- "md5sum":
|
||||||
|
description: Create an SHA256 (256-bit) checksum.
|
||||||
|
homepage: "https://www.gnu.org"
|
||||||
|
documentation: "https://linux.die.net/man/1/shasum"
|
||||||
|
licence: GPLv3+
|
||||||
|
|
||||||
|
input:
|
||||||
|
- meta:
|
||||||
|
type: map
|
||||||
|
description: |
|
||||||
|
Groovy Map containing sample information
|
||||||
|
e.g. [ id:'test', single_end:false ]
|
||||||
|
- file:
|
||||||
|
type: file
|
||||||
|
description: Any file
|
||||||
|
pattern: "*.*"
|
||||||
|
|
||||||
|
output:
|
||||||
|
- meta:
|
||||||
|
type: map
|
||||||
|
description: |
|
||||||
|
Groovy Map containing sample information
|
||||||
|
e.g. [ id:'test', single_end:false ]
|
||||||
|
- versions:
|
||||||
|
type: file
|
||||||
|
description: File containing software versions
|
||||||
|
pattern: "versions.yml"
|
||||||
|
- checksum:
|
||||||
|
type: file
|
||||||
|
description: File containing checksum
|
||||||
|
pattern: "*.sha256"
|
||||||
|
|
||||||
|
authors:
|
||||||
|
- "@matthdsm"
|
|
@ -2,10 +2,10 @@ process SVDB_MERGE {
|
||||||
tag "$meta.id"
|
tag "$meta.id"
|
||||||
label 'process_medium'
|
label 'process_medium'
|
||||||
|
|
||||||
conda (params.enable_conda ? "bioconda::svdb=2.6.0" : null)
|
conda (params.enable_conda ? "bioconda::svdb=2.6.1" : null)
|
||||||
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
||||||
'https://depot.galaxyproject.org/singularity/svdb:2.6.0--py39h5371cbf_0':
|
'https://depot.galaxyproject.org/singularity/svdb:2.6.1--py39h5371cbf_0':
|
||||||
'quay.io/biocontainers/svdb:2.6.0--py39h5371cbf_0' }"
|
'quay.io/biocontainers/svdb:2.6.1--py39h5371cbf_0' }"
|
||||||
|
|
||||||
input:
|
input:
|
||||||
tuple val(meta), path(vcfs)
|
tuple val(meta), path(vcfs)
|
||||||
|
|
|
@ -2,10 +2,10 @@ process SVDB_QUERY {
|
||||||
tag "$meta.id"
|
tag "$meta.id"
|
||||||
label 'process_medium'
|
label 'process_medium'
|
||||||
|
|
||||||
conda (params.enable_conda ? "bioconda::svdb=2.6.0" : null)
|
conda (params.enable_conda ? "bioconda::svdb=2.6.1" : null)
|
||||||
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
container "${ workflow.containerEngine == 'singularity' && !task.ext.singularity_pull_docker_container ?
|
||||||
'https://depot.galaxyproject.org/singularity/svdb:2.6.0--py39h5371cbf_0':
|
'https://depot.galaxyproject.org/singularity/svdb:2.6.1--py39h5371cbf_0':
|
||||||
'quay.io/biocontainers/svdb:2.6.0--py39h5371cbf_0' }"
|
'quay.io/biocontainers/svdb:2.6.1--py39h5371cbf_0' }"
|
||||||
|
|
||||||
input:
|
input:
|
||||||
tuple val(meta), path(vcf)
|
tuple val(meta), path(vcf)
|
||||||
|
|
|
@ -337,6 +337,10 @@ bracken/bracken:
|
||||||
- modules/bracken/bracken/**
|
- modules/bracken/bracken/**
|
||||||
- tests/modules/bracken/bracken/**
|
- tests/modules/bracken/bracken/**
|
||||||
|
|
||||||
|
busco:
|
||||||
|
- modules/busco/**
|
||||||
|
- tests/modules/busco/**
|
||||||
|
|
||||||
bwa/aln:
|
bwa/aln:
|
||||||
- modules/bwa/aln/**
|
- modules/bwa/aln/**
|
||||||
- tests/modules/bwa/aln/**
|
- tests/modules/bwa/aln/**
|
||||||
|
@ -1062,10 +1066,6 @@ krona/kronadb:
|
||||||
- modules/krona/kronadb/**
|
- modules/krona/kronadb/**
|
||||||
- tests/modules/krona/kronadb/**
|
- tests/modules/krona/kronadb/**
|
||||||
|
|
||||||
krona/ktupdatetaxonomy:
|
|
||||||
- modules/krona/ktupdatetaxonomy/**
|
|
||||||
- tests/modules/krona/ktupdatetaxonomy/**
|
|
||||||
|
|
||||||
krona/ktimporttaxonomy:
|
krona/ktimporttaxonomy:
|
||||||
- modules/krona/ktimporttaxonomy/**
|
- modules/krona/ktimporttaxonomy/**
|
||||||
- tests/modules/krona/ktimporttaxonomy/**
|
- tests/modules/krona/ktimporttaxonomy/**
|
||||||
|
@ -1074,6 +1074,10 @@ krona/ktimporttext:
|
||||||
- modules/krona/ktimporttext/**
|
- modules/krona/ktimporttext/**
|
||||||
- tests/modules/krona/ktimporttext/**
|
- tests/modules/krona/ktimporttext/**
|
||||||
|
|
||||||
|
krona/ktupdatetaxonomy:
|
||||||
|
- modules/krona/ktupdatetaxonomy/**
|
||||||
|
- tests/modules/krona/ktupdatetaxonomy/**
|
||||||
|
|
||||||
last/dotplot:
|
last/dotplot:
|
||||||
- modules/last/dotplot/**
|
- modules/last/dotplot/**
|
||||||
- tests/modules/last/dotplot/**
|
- tests/modules/last/dotplot/**
|
||||||
|
@ -1194,6 +1198,10 @@ maxbin2:
|
||||||
- modules/maxbin2/**
|
- modules/maxbin2/**
|
||||||
- tests/modules/maxbin2/**
|
- tests/modules/maxbin2/**
|
||||||
|
|
||||||
|
md5sum:
|
||||||
|
- modules/md5sum/**
|
||||||
|
- tests/modules/md5sum/**
|
||||||
|
|
||||||
medaka:
|
medaka:
|
||||||
- modules/medaka/**
|
- modules/medaka/**
|
||||||
- tests/modules/medaka/**
|
- tests/modules/medaka/**
|
||||||
|
@ -1739,6 +1747,10 @@ seqwish/induce:
|
||||||
- modules/seqwish/induce/**
|
- modules/seqwish/induce/**
|
||||||
- tests/modules/seqwish/induce/**
|
- tests/modules/seqwish/induce/**
|
||||||
|
|
||||||
|
shasum:
|
||||||
|
- modules/shasum/**
|
||||||
|
- tests/modules/shasum/**
|
||||||
|
|
||||||
shigatyper:
|
shigatyper:
|
||||||
- modules/shigatyper/**
|
- modules/shigatyper/**
|
||||||
- tests/modules/shigatyper/**
|
- tests/modules/shigatyper/**
|
||||||
|
|
404
tests/modules/busco/main.nf
Normal file
404
tests/modules/busco/main.nf
Normal file
|
@ -0,0 +1,404 @@
|
||||||
|
#!/usr/bin/env nextflow
|
||||||
|
|
||||||
|
nextflow.enable.dsl = 2
|
||||||
|
|
||||||
|
include { BUSCO } from '../../../modules/busco/main.nf'
|
||||||
|
|
||||||
|
workflow test_busco_genome_single_fasta {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test' ], // meta map
|
||||||
|
file( params.test_data['bacteroides_fragilis']['genome']['genome_fna_gz'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
BUSCO (
|
||||||
|
input,
|
||||||
|
['bacteria_odb10', 'bacteroidetes_odb10'], // Launch with 'auto' to use --auto-lineage, and specified lineages // 'auto' removed from test due to memory issues
|
||||||
|
[], // Download busco lineage
|
||||||
|
[], // No config
|
||||||
|
)
|
||||||
|
|
||||||
|
/* Output tree:
|
||||||
|
/tmp/tmpyz_hi62i/busco/
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fna.json -> /tmp/tmpza_0dth3/33/7d8c9b2c8931d9ad6a67aa843895e7/short_summary.specific.bacteria_odb10.genome.fna.json
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fna.txt -> /tmp/tmpza_0dth3/33/7d8c9b2c8931d9ad6a67aa843895e7/short_summary.specific.bacteria_odb10.genome.fna.txt
|
||||||
|
├── short_summary.specific.bacteroidetes_odb10.genome.fna.json -> /tmp/tmpza_0dth3/6a/e95a0cd21785ce33d63b8f73a68a51/short_summary.specific.bacteroidetes_odb10.genome.fna.json
|
||||||
|
├── short_summary.specific.bacteroidetes_odb10.genome.fna.txt -> /tmp/tmpza_0dth3/6a/e95a0cd21785ce33d63b8f73a68a51/short_summary.specific.bacteroidetes_odb10.genome.fna.txt
|
||||||
|
├── test-bacteria_odb10-busco -> /tmp/tmpza_0dth3/33/7d8c9b2c8931d9ad6a67aa843895e7/test-bacteria_odb10-busco/
|
||||||
|
│ ├── genome.fna/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ └── prodigal_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ └── run_bacteria_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-bacteria_odb10-busco.batch_summary.txt -> /tmp/tmpza_0dth3/33/7d8c9b2c8931d9ad6a67aa843895e7/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
├── test-bacteroidetes_odb10-busco -> /tmp/tmpza_0dth3/6a/e95a0cd21785ce33d63b8f73a68a51/test-bacteroidetes_odb10-busco/
|
||||||
|
│ ├── genome.fna/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ └── prodigal_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ └── run_bacteroidetes_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-bacteroidetes_odb10-busco.batch_summary.txt -> /tmp/tmpza_0dth3/6a/e95a0cd21785ce33d63b8f73a68a51/test-bacteroidetes_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmpza_0dth3/6a/e95a0cd21785ce33d63b8f73a68a51/versions.yml
|
||||||
|
|
||||||
|
Former Output tree -w 'auto':
|
||||||
|
/tmp/tmp846crjv2/busco/
|
||||||
|
├── short_summary.generic.bacteria_odb10.genome.fna.json -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/short_summary.generic.bacteria_odb10.genome.fna.json
|
||||||
|
├── short_summary.generic.bacteria_odb10.genome.fna.txt -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/short_summary.generic.bacteria_odb10.genome.fna.txt
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fna.json -> /tmp/tmpi6af66j1/45/107812e983a8e695c380ebc215e7d9/short_summary.specific.bacteria_odb10.genome.fna.json
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fna.txt -> /tmp/tmpi6af66j1/45/107812e983a8e695c380ebc215e7d9/short_summary.specific.bacteria_odb10.genome.fna.txt
|
||||||
|
├── short_summary.specific.bacteroidales_odb10.genome.fna.json -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/short_summary.specific.bacteroidales_odb10.genome.fna.json
|
||||||
|
├── short_summary.specific.bacteroidales_odb10.genome.fna.txt -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/short_summary.specific.bacteroidales_odb10.genome.fna.txt
|
||||||
|
├── short_summary.specific.bacteroidetes_odb10.genome.fna.json -> /tmp/tmpi6af66j1/a2/eb4a34894f3ac5554759ad6c9f652b/short_summary.specific.bacteroidetes_odb10.genome.fna.json
|
||||||
|
├── short_summary.specific.bacteroidetes_odb10.genome.fna.txt -> /tmp/tmpi6af66j1/a2/eb4a34894f3ac5554759ad6c9f652b/short_summary.specific.bacteroidetes_odb10.genome.fna.txt
|
||||||
|
├── test-auto-busco -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/test-auto-busco/
|
||||||
|
│ ├── genome.fna/
|
||||||
|
│ │ ├── auto_lineage/
|
||||||
|
│ │ │ ├── run_archaea_odb10/
|
||||||
|
│ │ │ ├── run_bacteria_odb10/
|
||||||
|
│ │ │ └── run_eukaryota_odb10/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── metaeuk_err.log
|
||||||
|
│ │ │ ├── metaeuk_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ ├── prodigal_out.log
|
||||||
|
│ │ │ ├── sepp_err.log
|
||||||
|
│ │ │ └── sepp_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ ├── run_bacteria_odb10 -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/test-auto-busco/genome.fna/auto_lineage/run_bacteria_odb10/ [recursive, not followed]
|
||||||
|
│ │ └── run_bacteroidales_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-auto-busco.batch_summary.txt -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/test-auto-busco.batch_summary.txt
|
||||||
|
├── test-bacteria_odb10-busco -> /tmp/tmpi6af66j1/45/107812e983a8e695c380ebc215e7d9/test-bacteria_odb10-busco/
|
||||||
|
│ ├── genome.fna/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ └── prodigal_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ └── run_bacteria_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-bacteria_odb10-busco.batch_summary.txt -> /tmp/tmpi6af66j1/45/107812e983a8e695c380ebc215e7d9/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
├── test-bacteroidetes_odb10-busco -> /tmp/tmpi6af66j1/a2/eb4a34894f3ac5554759ad6c9f652b/test-bacteroidetes_odb10-busco/
|
||||||
|
│ ├── genome.fna/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ └── prodigal_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ └── run_bacteroidetes_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-bacteroidetes_odb10-busco.batch_summary.txt -> /tmp/tmpi6af66j1/a2/eb4a34894f3ac5554759ad6c9f652b/test-bacteroidetes_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmpi6af66j1/18/8be22ecd7a71471ff5082bd512972b/versions.yml
|
||||||
|
*/
|
||||||
|
|
||||||
|
}
|
||||||
|
|
||||||
|
workflow test_busco_genome_multi_fasta {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test' ], // meta map
|
||||||
|
[
|
||||||
|
file( params.test_data['bacteroides_fragilis']['genome']['genome_fna_gz'], checkIfExists: true),
|
||||||
|
file( params.test_data['candidatus_portiera_aleyrodidarum']['genome']['genome_fasta'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
]
|
||||||
|
|
||||||
|
BUSCO (
|
||||||
|
input,
|
||||||
|
'bacteria_odb10',
|
||||||
|
[], // Download busco lineage
|
||||||
|
[], // No config
|
||||||
|
)
|
||||||
|
|
||||||
|
/* Output tree:
|
||||||
|
/tmp/tmpk19byek7/busco/
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fasta.json -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/short_summary.specific.bacteria_odb10.genome.fasta.json
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fasta.txt -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/short_summary.specific.bacteria_odb10.genome.fasta.txt
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fna.json -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/short_summary.specific.bacteria_odb10.genome.fna.json
|
||||||
|
├── short_summary.specific.bacteria_odb10.genome.fna.txt -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/short_summary.specific.bacteria_odb10.genome.fna.txt
|
||||||
|
├── test-bacteria_odb10-busco -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/test-bacteria_odb10-busco/
|
||||||
|
│ ├── genome.fasta/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ └── prodigal_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ └── run_bacteria_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ ├── genome.fna/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── prodigal_err.log
|
||||||
|
│ │ │ └── prodigal_out.log
|
||||||
|
│ │ ├── prodigal_output/
|
||||||
|
│ │ │ └── predicted_genes/
|
||||||
|
│ │ └── run_bacteria_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-bacteria_odb10-busco.batch_summary.txt -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmplt9fv3tl/15/ff310a16d9ce7ad24e207a05ce718e/versions.yml
|
||||||
|
*/
|
||||||
|
|
||||||
|
}
|
||||||
|
|
||||||
|
workflow test_busco_eukaryote_metaeuk {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test' ], // meta map
|
||||||
|
file( params.test_data['homo_sapiens']['genome']['genome_fasta'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
BUSCO (
|
||||||
|
input,
|
||||||
|
'eukaryota_odb10',
|
||||||
|
[], // Download busco lineage
|
||||||
|
[], // No config
|
||||||
|
)
|
||||||
|
|
||||||
|
/* Output tree:
|
||||||
|
/tmp/tmpeq4dsir5/busco/
|
||||||
|
├── short_summary.specific.eukaryota_odb10.genome.fasta.json -> /tmp/tmp60hby2pk/6f/529873d91cda6bae3a4a6a21746aee/short_summary.specific.eukaryota_odb10.genome.fasta.json
|
||||||
|
├── short_summary.specific.eukaryota_odb10.genome.fasta.txt -> /tmp/tmp60hby2pk/6f/529873d91cda6bae3a4a6a21746aee/short_summary.specific.eukaryota_odb10.genome.fasta.txt
|
||||||
|
├── test-eukaryota_odb10-busco -> /tmp/tmp60hby2pk/6f/529873d91cda6bae3a4a6a21746aee/test-eukaryota_odb10-busco/
|
||||||
|
│ ├── genome.fasta/
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── hmmsearch_err.log
|
||||||
|
│ │ │ ├── hmmsearch_out.log
|
||||||
|
│ │ │ ├── metaeuk_err.log
|
||||||
|
│ │ │ └── metaeuk_out.log
|
||||||
|
│ │ └── run_eukaryota_odb10/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── metaeuk_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ └── short_summary.txt
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-eukaryota_odb10-busco.batch_summary.txt -> /tmp/tmp60hby2pk/6f/529873d91cda6bae3a4a6a21746aee/test-eukaryota_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmp60hby2pk/6f/529873d91cda6bae3a4a6a21746aee/versions.yml
|
||||||
|
*/
|
||||||
|
|
||||||
|
}
|
||||||
|
|
||||||
|
workflow test_busco_eukaryote_augustus {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test' ], // meta map
|
||||||
|
file( params.test_data['homo_sapiens']['genome']['genome_fasta'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
BUSCO (
|
||||||
|
input,
|
||||||
|
'eukaryota_odb10',
|
||||||
|
[], // Download busco lineage
|
||||||
|
[], // No config
|
||||||
|
)
|
||||||
|
|
||||||
|
/* Output tree:
|
||||||
|
/tmp/tmp2xqaygjj/busco/
|
||||||
|
├── test-eukaryota_odb10-busco -> /tmp/tmpjqs61x9o/3f/67cc14e873c0ceb45e2a27594d624c/test-eukaryota_odb10-busco/
|
||||||
|
│ ├── genome.fasta/
|
||||||
|
│ │ ├── blast_db/
|
||||||
|
│ │ │ ├── genome.fasta.ndb
|
||||||
|
│ │ │ ├── genome.fasta.nhr
|
||||||
|
│ │ │ ├── genome.fasta.nin
|
||||||
|
│ │ │ ├── genome.fasta.not
|
||||||
|
│ │ │ ├── genome.fasta.nsq
|
||||||
|
│ │ │ ├── genome.fasta.ntf
|
||||||
|
│ │ │ └── genome.fasta.nto
|
||||||
|
│ │ ├── logs/
|
||||||
|
│ │ │ ├── makeblastdb_err.log
|
||||||
|
│ │ │ ├── makeblastdb_out.log
|
||||||
|
│ │ │ ├── tblastn_err.log
|
||||||
|
│ │ │ └── tblastn_out.log
|
||||||
|
│ │ └── run_eukaryota_odb10/
|
||||||
|
│ │ ├── augustus_output/
|
||||||
|
│ │ ├── blast_output/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ └── hmmer_output/
|
||||||
|
│ └── logs/
|
||||||
|
│ └── busco.log
|
||||||
|
├── test-eukaryota_odb10-busco.batch_summary.txt -> /tmp/tmpjqs61x9o/3f/67cc14e873c0ceb45e2a27594d624c/test-eukaryota_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmpjqs61x9o/3f/67cc14e873c0ceb45e2a27594d624c/versions.yml
|
||||||
|
*/
|
||||||
|
|
||||||
|
}
|
||||||
|
|
||||||
|
workflow test_busco_protein {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test' ], // meta map
|
||||||
|
file( params.test_data['candidatus_portiera_aleyrodidarum']['genome']['proteome_fasta'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
BUSCO (
|
||||||
|
input,
|
||||||
|
'bacteria_odb10',
|
||||||
|
[], // Download busco lineage
|
||||||
|
[], // No config
|
||||||
|
)
|
||||||
|
|
||||||
|
/* Output tree:
|
||||||
|
/tmp/tmpzwd5dn56/busco/
|
||||||
|
├── short_summary.specific.bacteria_odb10.proteome.fasta.json -> /tmp/tmpk1nlgbf_/ae/0db07b5cd08fb23d0aba5f134ebbe2/short_summary.specific.bacteria_odb10.proteome.fasta.json
|
||||||
|
├── short_summary.specific.bacteria_odb10.proteome.fasta.txt -> /tmp/tmpk1nlgbf_/ae/0db07b5cd08fb23d0aba5f134ebbe2/short_summary.specific.bacteria_odb10.proteome.fasta.txt
|
||||||
|
├── test-bacteria_odb10-busco -> /tmp/tmpk1nlgbf_/ae/0db07b5cd08fb23d0aba5f134ebbe2/test-bacteria_odb10-busco/
|
||||||
|
│ ├── logs/
|
||||||
|
│ │ └── busco.log
|
||||||
|
│ └── proteome.fasta/
|
||||||
|
│ ├── logs/
|
||||||
|
│ │ ├── hmmsearch_err.log
|
||||||
|
│ │ └── hmmsearch_out.log
|
||||||
|
│ └── run_bacteria_odb10/
|
||||||
|
│ ├── busco_sequences/
|
||||||
|
│ ├── full_table.tsv
|
||||||
|
│ ├── hmmer_output/
|
||||||
|
│ ├── missing_busco_list.tsv
|
||||||
|
│ ├── short_summary.json
|
||||||
|
│ └── short_summary.txt
|
||||||
|
├── test-bacteria_odb10-busco.batch_summary.txt -> /tmp/tmpk1nlgbf_/ae/0db07b5cd08fb23d0aba5f134ebbe2/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmpk1nlgbf_/ae/0db07b5cd08fb23d0aba5f134ebbe2/versions.yml
|
||||||
|
*/
|
||||||
|
}
|
||||||
|
workflow test_busco_transcriptome {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test' ], // meta map
|
||||||
|
file( params.test_data['bacteroides_fragilis']['illumina']['test1_contigs_fa_gz'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
BUSCO (
|
||||||
|
input,
|
||||||
|
'bacteria_odb10',
|
||||||
|
[], // Download busco lineage
|
||||||
|
[], // No config
|
||||||
|
)
|
||||||
|
|
||||||
|
/* Output tree:
|
||||||
|
/tmp/tmpitjyvo9g/busco/
|
||||||
|
├── short_summary.specific.bacteria_odb10.test1.contigs.fa.json -> /tmp/tmp6wqi0eyx/4f/ed0b23f0fc807bb68091298845c135/short_summary.specific.bacteria_odb10.test1.contigs.fa.json
|
||||||
|
├── short_summary.specific.bacteria_odb10.test1.contigs.fa.txt -> /tmp/tmp6wqi0eyx/4f/ed0b23f0fc807bb68091298845c135/short_summary.specific.bacteria_odb10.test1.contigs.fa.txt
|
||||||
|
├── test-bacteria_odb10-busco -> /tmp/tmp6wqi0eyx/4f/ed0b23f0fc807bb68091298845c135/test-bacteria_odb10-busco/
|
||||||
|
│ ├── logs/
|
||||||
|
│ │ └── busco.log
|
||||||
|
│ └── test1.contigs.fa/
|
||||||
|
│ ├── blast_db/
|
||||||
|
│ │ ├── test1.contigs.fa.ndb
|
||||||
|
│ │ ├── test1.contigs.fa.nhr
|
||||||
|
│ │ ├── test1.contigs.fa.nin
|
||||||
|
│ │ ├── test1.contigs.fa.not
|
||||||
|
│ │ ├── test1.contigs.fa.nsq
|
||||||
|
│ │ ├── test1.contigs.fa.ntf
|
||||||
|
│ │ └── test1.contigs.fa.nto
|
||||||
|
│ ├── logs/
|
||||||
|
│ │ ├── hmmsearch_err.log
|
||||||
|
│ │ ├── hmmsearch_out.log
|
||||||
|
│ │ ├── makeblastdb_err.log
|
||||||
|
│ │ ├── makeblastdb_out.log
|
||||||
|
│ │ ├── tblastn_err.log
|
||||||
|
│ │ └── tblastn_out.log
|
||||||
|
│ ├── run_bacteria_odb10/
|
||||||
|
│ │ ├── blast_output/
|
||||||
|
│ │ ├── busco_sequences/
|
||||||
|
│ │ ├── full_table.tsv
|
||||||
|
│ │ ├── hmmer_output/
|
||||||
|
│ │ ├── missing_busco_list.tsv
|
||||||
|
│ │ ├── short_summary.json
|
||||||
|
│ │ ├── short_summary.txt
|
||||||
|
│ │ └── single_copy_proteins.faa
|
||||||
|
│ └── translated_proteins/
|
||||||
|
│ ├── 1024388at2.faa
|
||||||
|
│ ├── 1054741at2.faa
|
||||||
|
│ ├── 1093223at2.faa
|
||||||
|
│ ├── 1151822at2.faa
|
||||||
|
│ ├── 143460at2.faa
|
||||||
|
│ ├── 1491686at2.faa
|
||||||
|
│ ├── 1504821at2.faa
|
||||||
|
│ ├── 1574817at2.faa
|
||||||
|
│ ├── 1592033at2.faa
|
||||||
|
│ ├── 1623045at2.faa
|
||||||
|
│ ├── 1661836at2.faa
|
||||||
|
│ ├── 1674344at2.faa
|
||||||
|
│ ├── 1698718at2.faa
|
||||||
|
│ ├── 1990650at2.faa
|
||||||
|
│ ├── 223233at2.faa
|
||||||
|
│ ├── 402899at2.faa
|
||||||
|
│ ├── 505485at2.faa
|
||||||
|
│ ├── 665824at2.faa
|
||||||
|
│ ├── 776861at2.faa
|
||||||
|
│ ├── 874197at2.faa
|
||||||
|
│ ├── 932854at2.faa
|
||||||
|
│ └── 95696at2.faa
|
||||||
|
├── test-bacteria_odb10-busco.batch_summary.txt -> /tmp/tmp6wqi0eyx/4f/ed0b23f0fc807bb68091298845c135/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
└── versions.yml -> /tmp/tmp6wqi0eyx/4f/ed0b23f0fc807bb68091298845c135/versions.yml
|
||||||
|
*/
|
||||||
|
|
||||||
|
}
|
28
tests/modules/busco/nextflow.config
Normal file
28
tests/modules/busco/nextflow.config
Normal file
|
@ -0,0 +1,28 @@
|
||||||
|
process {
|
||||||
|
|
||||||
|
publishDir = { "${params.outdir}/${task.process.tokenize(':')[-1].tokenize('_')[0].toLowerCase()}" }
|
||||||
|
|
||||||
|
withName: 'test_busco_genome_single_fasta:BUSCO' {
|
||||||
|
ext.args = '--mode genome'
|
||||||
|
}
|
||||||
|
|
||||||
|
withName: 'test_busco_genome_multi_fasta:BUSCO' {
|
||||||
|
ext.args = '--mode genome'
|
||||||
|
}
|
||||||
|
|
||||||
|
withName: 'test_busco_eukaryote_metaeuk:BUSCO' {
|
||||||
|
ext.args = '--mode genome'
|
||||||
|
}
|
||||||
|
|
||||||
|
withName: 'test_busco_eukaryote_augustus:BUSCO' {
|
||||||
|
ext.args = '--mode genome --augustus'
|
||||||
|
}
|
||||||
|
|
||||||
|
withName: 'test_busco_protein:BUSCO' {
|
||||||
|
ext.args = '--mode proteins'
|
||||||
|
}
|
||||||
|
|
||||||
|
withName: 'test_busco_transcriptome:BUSCO'{
|
||||||
|
ext.args = '--mode transcriptome'
|
||||||
|
}
|
||||||
|
}
|
159
tests/modules/busco/test.yml
Normal file
159
tests/modules/busco/test.yml
Normal file
|
@ -0,0 +1,159 @@
|
||||||
|
- name: busco test_busco_genome_single_fasta
|
||||||
|
command: nextflow run tests/modules/busco -entry test_busco_genome_single_fasta -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- busco
|
||||||
|
files:
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.genome.fna.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.genome.fna.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/short_summary.specific.bacteroidetes_odb10.genome.fna.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.bacteroidetes_odb10.genome.fna.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: e50690742e9ae6abdd2bf99334ff9e12
|
||||||
|
- path: output/busco/test-bacteroidetes_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: 4c1b2c4317c88398eddc30877ed740d9
|
||||||
|
- path: output/busco/versions.yml
|
||||||
|
md5sum: 8aa830f71587d859df35c6cfab59f35d
|
||||||
|
|
||||||
|
- name: busco test_busco_genome_multi_fasta
|
||||||
|
command: nextflow run tests/modules/busco -entry test_busco_genome_multi_fasta -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- busco
|
||||||
|
files:
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.genome.fasta.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.genome.fasta.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.genome.fna.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.genome.fna.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: 5360dfe83bec1f5741ee115e53e6b517
|
||||||
|
- path: output/busco/versions.yml
|
||||||
|
md5sum: 9a959eb0a1f765777dff1ea2f5c139c0
|
||||||
|
|
||||||
|
- name: busco test_busco_eukaryote_metaeuk
|
||||||
|
command: nextflow run tests/modules/busco -entry test_busco_eukaryote_metaeuk -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- busco
|
||||||
|
files:
|
||||||
|
- path: output/busco/short_summary.specific.eukaryota_odb10.genome.fasta.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.eukaryota_odb10.genome.fasta.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/test-eukaryota_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: a70806f99ba5706d7353d3353b3f1d2b
|
||||||
|
- path: output/busco/versions.yml
|
||||||
|
md5sum: 34a808c257e6db1b0456f3b4372bc477
|
||||||
|
|
||||||
|
- name: busco test_busco_eukaryote_augustus
|
||||||
|
command: nextflow run tests/modules/busco -entry test_busco_eukaryote_augustus -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- busco
|
||||||
|
files:
|
||||||
|
- path: output/busco/test-eukaryota_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: 660393dd43cd6a093b952d4b8ad41e40
|
||||||
|
- path: output/busco/versions.yml
|
||||||
|
md5sum: 2caac915461410b16a1524ac064cd0df
|
||||||
|
|
||||||
|
- name: busco test_busco_protein
|
||||||
|
command: nextflow run tests/modules/busco -entry test_busco_protein -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- busco
|
||||||
|
files:
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.proteome.fasta.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.proteome.fasta.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: fd3b4e30ce74d1fcb95d6286d6e2049f
|
||||||
|
- path: output/busco/versions.yml
|
||||||
|
md5sum: d7392261a57960a7e6aea609dce824f5
|
||||||
|
|
||||||
|
- name: busco test_busco_transcriptome
|
||||||
|
command: nextflow run tests/modules/busco -entry test_busco_transcriptome -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- busco
|
||||||
|
files:
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.test1.contigs.fa.json
|
||||||
|
contains:
|
||||||
|
- "one_line_summary"
|
||||||
|
- "input_file"
|
||||||
|
- "mode"
|
||||||
|
- "dataset"
|
||||||
|
- path: output/busco/short_summary.specific.bacteria_odb10.test1.contigs.fa.txt
|
||||||
|
contains:
|
||||||
|
- "BUSCO version"
|
||||||
|
- "The lineage dataset is"
|
||||||
|
- "BUSCO was run in mode"
|
||||||
|
- "Complete BUSCOs"
|
||||||
|
- "Missing BUSCOs"
|
||||||
|
- "Dependencies and versions"
|
||||||
|
- path: output/busco/test-bacteria_odb10-busco.batch_summary.txt
|
||||||
|
md5sum: 9a176cafe66ac0adca89dc34ad2be13f
|
||||||
|
- path: output/busco/versions.yml
|
||||||
|
md5sum: 30eacbc7df70f6b1e72e0a7b6d02a7e1
|
|
@ -8,7 +8,7 @@ workflow test_cnvpytor_view {
|
||||||
|
|
||||||
input = [
|
input = [
|
||||||
[ id:'test'], // meta map
|
[ id:'test'], // meta map
|
||||||
file(params.test_data['homo_sapiens']['illumina']['test_pytor'], checkIfExists: true)
|
[file(params.test_data['homo_sapiens']['illumina']['test_pytor'], checkIfExists: true)]
|
||||||
]
|
]
|
||||||
|
|
||||||
bin_sizes = "10000 100000"
|
bin_sizes = "10000 100000"
|
||||||
|
@ -20,7 +20,7 @@ workflow test_cnvpytor_view_tsvout {
|
||||||
|
|
||||||
input = [
|
input = [
|
||||||
[ id:'test'], // meta map
|
[ id:'test'], // meta map
|
||||||
file(params.test_data['homo_sapiens']['illumina']['test_pytor'], checkIfExists: true)
|
[file(params.test_data['homo_sapiens']['illumina']['test_pytor'], checkIfExists: true)]
|
||||||
]
|
]
|
||||||
|
|
||||||
output_suffix = "tsv"
|
output_suffix = "tsv"
|
||||||
|
@ -32,7 +32,7 @@ workflow test_cnvpytor_view_stub {
|
||||||
|
|
||||||
input = [
|
input = [
|
||||||
[ id:'test'], // meta map
|
[ id:'test'], // meta map
|
||||||
file(params.test_data['homo_sapiens']['illumina']['test_pytor'], checkIfExists: true)
|
[file(params.test_data['homo_sapiens']['illumina']['test_pytor'], checkIfExists: true)]
|
||||||
]
|
]
|
||||||
|
|
||||||
bin_sizes = []
|
bin_sizes = []
|
||||||
|
|
15
tests/modules/md5sum/main.nf
Normal file
15
tests/modules/md5sum/main.nf
Normal file
|
@ -0,0 +1,15 @@
|
||||||
|
#!/usr/bin/env nextflow
|
||||||
|
|
||||||
|
nextflow.enable.dsl = 2
|
||||||
|
|
||||||
|
include { MD5SUM } from '../../../modules/md5sum/main.nf'
|
||||||
|
|
||||||
|
workflow test_md5sum {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test', single_end:false ], // meta map
|
||||||
|
file(params.test_data['sarscov2']['illumina']['test_paired_end_bam'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
MD5SUM ( input )
|
||||||
|
}
|
3
tests/modules/md5sum/nextflow.config
Normal file
3
tests/modules/md5sum/nextflow.config
Normal file
|
@ -0,0 +1,3 @@
|
||||||
|
process {
|
||||||
|
publishDir = { "${params.outdir}/${task.process.tokenize(':')[-1].tokenize('_')[0].toLowerCase()}" }
|
||||||
|
}
|
8
tests/modules/md5sum/test.yml
Normal file
8
tests/modules/md5sum/test.yml
Normal file
|
@ -0,0 +1,8 @@
|
||||||
|
- name: md5sum test_md5sum
|
||||||
|
command: nextflow run tests/modules/md5sum -entry test_md5sum -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- md5sum
|
||||||
|
files:
|
||||||
|
- path: output/md5sum/test.paired_end.bam.md5
|
||||||
|
md5sum: 1163095be8fdfb2acb3cc6c027389c4b
|
||||||
|
- path: output/md5sum/versions.yml
|
15
tests/modules/shasum/main.nf
Normal file
15
tests/modules/shasum/main.nf
Normal file
|
@ -0,0 +1,15 @@
|
||||||
|
#!/usr/bin/env nextflow
|
||||||
|
|
||||||
|
nextflow.enable.dsl = 2
|
||||||
|
|
||||||
|
include { SHASUM } from '../../../modules/shasum/main.nf'
|
||||||
|
|
||||||
|
workflow test_shasum {
|
||||||
|
|
||||||
|
input = [
|
||||||
|
[ id:'test', single_end:false ], // meta map
|
||||||
|
file(params.test_data['sarscov2']['illumina']['test_paired_end_bam'], checkIfExists: true)
|
||||||
|
]
|
||||||
|
|
||||||
|
SHASUM ( input )
|
||||||
|
}
|
5
tests/modules/shasum/nextflow.config
Normal file
5
tests/modules/shasum/nextflow.config
Normal file
|
@ -0,0 +1,5 @@
|
||||||
|
process {
|
||||||
|
|
||||||
|
publishDir = { "${params.outdir}/${task.process.tokenize(':')[-1].tokenize('_')[0].toLowerCase()}" }
|
||||||
|
|
||||||
|
}
|
8
tests/modules/shasum/test.yml
Normal file
8
tests/modules/shasum/test.yml
Normal file
|
@ -0,0 +1,8 @@
|
||||||
|
- name: shasum test_shasum
|
||||||
|
command: nextflow run tests/modules/shasum -entry test_shasum -c tests/config/nextflow.config
|
||||||
|
tags:
|
||||||
|
- shasum
|
||||||
|
files:
|
||||||
|
- path: output/shasum/test.paired_end.bam.sha256
|
||||||
|
md5sum: 138a19e100f09fc975ea1b717da9b6dd
|
||||||
|
- path: output/shasum/versions.yml
|
Loading…
Add table
Reference in a new issue