test(picard): Refactor markduplicates to use pytest-workflow

2024-12-22 02:58:17 +00:00 · 2020-11-24 19:38:10 -06:00 · 2020-11-24 19:38:10 -06:00 · 7848019cdb
commit 7848019cdb
parent d009420a0c
7 changed files with 20 additions and 52 deletions
--- a/software/picard/markduplicates/test/input/test.paired_end.sorted.bam
+++ b/software/picard/markduplicates/test/input/test.paired_end.sorted.bam
@ -1 +0,0 @@
-../../../../../tests/data/bam/test.paired_end.sorted.bam
--- a/software/picard/markduplicates/test/main.nf
+++ b/software/picard/markduplicates/test/main.nf
@ -1,18 +0,0 @@
-#!/usr/bin/env nextflow
-
-nextflow.enable.dsl = 2
-
-include { PICARD_MARKDUPLICATES } from '../main.nf' addParams( options: [:] )
-
-workflow test {
-
-    def input = []
-    input = [ [ id:'test', single_end:false ], // meta map
-              file("${baseDir}/input/test.paired_end.sorted.bam", checkIfExists: true) ]
-
-    PICARD_MARKDUPLICATES ( input )
-}
-
-workflow {
-    test()
-}
--- a/software/picard/markduplicates/test/nextflow.config
+++ b/software/picard/markduplicates/test/nextflow.config
@ -1,20 +0,0 @@
-
-params {
-    outdir = "output/"
-    publish_dir_mode = "copy"
-    enable_conda = false
-}
-
-profiles {
-    conda  {
-        params.enable_conda = true
-    }
-    docker {
-        docker.enabled = true
-        docker.runOptions = '-u \$(id -u):\$(id -g)'
-    }
-    singularity {
-        singularity.enabled = true
-        singularity.autoMounts = true
-    }
-}
--- a/software/picard/markduplicates/test/output/picard/test.MarkDuplicates.metrics.txt
+++ b/software/picard/markduplicates/test/output/picard/test.MarkDuplicates.metrics.txt
@ -1,13 +0,0 @@
-## htsjdk.samtools.metrics.StringHeader
-# MarkDuplicates INPUT=[test.paired_end.sorted.bam] OUTPUT=test.bam METRICS_FILE=test.MarkDuplicates.metrics.txt    MAX_SEQUENCES_FOR_DISK_READ_ENDS_MAP=50000 MAX_FILE_HANDLES_FOR_READ_ENDS_MAP=8000 SORTING_COLLECTION_SIZE_RATIO=0.25 TAG_DUPLICATE_SET_MEMBERS=false REMOVE_SEQUENCING_DUPLICATES=false TAGGING_POLICY=DontTag CLEAR_DT=true DUPLEX_UMI=false ADD_PG_TAG_TO_READS=true REMOVE_DUPLICATES=false ASSUME_SORTED=false DUPLICATE_SCORING_STRATEGY=SUM_OF_BASE_QUALITIES PROGRAM_RECORD_ID=MarkDuplicates PROGRAM_GROUP_NAME=MarkDuplicates READ_NAME_REGEX=<optimized capture of last three ':' separated fields as numeric values> OPTICAL_DUPLICATE_PIXEL_DISTANCE=100 MAX_OPTICAL_DUPLICATE_SET_SIZE=300000 VERBOSITY=INFO QUIET=false VALIDATION_STRINGENCY=STRICT COMPRESSION_LEVEL=5 MAX_RECORDS_IN_RAM=500000 CREATE_INDEX=false CREATE_MD5_FILE=false GA4GH_CLIENT_SECRETS=client_secrets.json USE_JDK_DEFLATER=false USE_JDK_INFLATER=false
-## htsjdk.samtools.metrics.StringHeader
-# Started on: Fri Aug 07 15:11:32 GMT 2020
-
-## METRICS CLASS	picard.sam.DuplicationMetrics
-LIBRARY	UNPAIRED_READS_EXAMINED	READ_PAIRS_EXAMINED	SECONDARY_OR_SUPPLEMENTARY_RDS	UNMAPPED_READS	UNPAIRED_READ_DUPLICATES	READ_PAIR_DUPLICATES	READ_PAIR_OPTICAL_DUPLICATES	PERCENT_DUPLICATION	ESTIMATED_LIBRARY_SIZE
-Unknown Library	0	10000	0	0	0	0	0	0	
-
-## HISTOGRAM	java.lang.Double
-set_size	all_sets	non_optical_sets
-1.0	10000	10000
-
--- a/software/picard/markduplicates/test/output/picard/test.bam
+++ b/software/picard/markduplicates/test/output/picard/test.bam
--- a/tests/software/picard/main.nf
+++ b/tests/software/picard/main.nf
@ -4,6 +4,7 @@ nextflow.enable.dsl = 2

 include { PICARD_MERGESAMFILES } from '../../../software/picard/mergesamfiles/main.nf' addParams( options: [:] )
 include { PICARD_COLLECTMULTIPLEMETRICS } from '../../../software/picard/collectmultiplemetrics/main.nf' addParams( options: [:] )
+include { PICARD_MARKDUPLICATES } from '../../../software/picard/markduplicates/main.nf' addParams( options: [:] )

 workflow test_picard_mergesamfiles {

@ -27,3 +28,12 @@ workflow test_picard_collectmultiplemetrics {
        file("${launchDir}/tests/data/fasta/E_coli/NC_010473.fa", checkIfExists: true)
    )
 }
+
+workflow test_picard_markduplicates  {
+
+    def input = []
+    input = [ [ id:'test', single_end:false ], // meta map
+              file("${launchDir}/tests/data/bam/test.paired_end.sorted.bam", checkIfExists: true) ]
+
+    PICARD_MARKDUPLICATES ( input )
+}
--- a/tests/software/picard/test.yml
+++ b/tests/software/picard/test.yml
@ -23,3 +23,13 @@
    - path: output/picard/test.CollectMultipleMetrics.quality_by_cycle_metrics
    - path: output/picard/test.CollectMultipleMetrics.quality_distribution.pdf
    - path: output/picard/test.CollectMultipleMetrics.quality_distribution_metrics
+
+- name: Run picard MarkDuplicates
+  command: nextflow run ./tests/software/picard -profile docker -entry test_picard_markduplicates -c tests/config/nextflow.config
+  tags:
+    - picard
+    - picard_markduplicates
+  files:
+    - path: output/picard/test.MarkDuplicates.metrics.txt
+    - path: output/picard/test.bam
+      md5sum: 50407a1ee722f2bf6a20471c8a7fd6b0
				`@ -1 +0,0 @@`
				`../../../../../tests/data/bam/test.paired_end.sorted.bam`