DNA パイプライン設定ファイルについて

パイプライン設定ファイルはGenomon実行時に読込まれるファイルです.各ツールのパスやパラメータを設定することができます.

注釈

HGCスパコンの場合,このファイルは /home/w3varann/genomon_pipeline-2.3.0/genomon_conf/ にあります.

exome解析用:dna_exome_genomon.cfg
wgs解析用:dna_wgs_genomon.cfg

ANNOVARの設定が必要ですので,まずは Quick Start DNA解析 から始めてください.

  1
  2
  3
  4
  5
  6
  7
  8
  9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 29
 30
 31
 32
 33
 34
 35
 36
 37
 38
 39
 40
 41
 42
 43
 44
 45
 46
 47
 48
 49
 50
 51
 52
 53
 54
 55
 56
 57
 58
 59
 60
 61
 62
 63
 64
 65
 66
 67
 68
 69
 70
 71
 72
 73
 74
 75
 76
 77
 78
 79
 80
 81
 82
 83
 84
 85
 86
 87
 88
 89
 90
 91
 92
 93
 94
 95
 96
 97
 98
 99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
#
# Genomon pipeline configuration file
#

[REFERENCE]
# prepared reference fasta file
ref_fasta                   = # the path to the GRCh37.fa
interval_list               = # the path to the GRCh37_noScaffold_noDecoy.interval_list
hg19_genome                 = # the path to the bedtools-2.24.0/genomes/human.hg19.genome
gaptxt                      = # the path to the gap.txt
bait_file                   = # the path to the refGene.coding.exon.151207.bed
simple_repeat_tabix_db      = # the path to the simpleRepeat.bed.bgz
HGVD_tabix_db               = # the path to the DBexome20131010.bed.gz

[SOFTWARE]
# prepared tools
blat                        = # the path to the blat_x86_64/blat
bwa                         = # the path to the bwa-0.7.8/bwa
samtools                    = # the path to the samtools-1.2/samtools
bedtools                    = # the path to the bedtools-2.24.0/bin/bedtools
biobambam                   = # the path to the biobambam-0.0.191/bin
bamstats                    = # the path to the PCAP-core-dev.20150511/bin/bam_stats.pl
htslib                      = # the path to the htslib-1.3
genomon_sv                  = # the path to the bin/GenomonSV
sv_utils                    = # the path to the bin/sv_utils
mutfilter                   = # the path to the bin/mutfilter
ebfilter                    = # the path to the bin/EBFilter
fisher                      = # the path to the bin/fisher
mutanno                     = # the path to the bin/mutanno
genomon_pa                  = # the path to the bin/genomon_pa
pa_plot                     = # the path to the bin/pa_plot
mutil                       = # the path to the bin/mutil

# ANNOVAR needs to be installed individually
annovar                     = # the path to the annovar

[ENV]
PERL5LIB                    = # the path to the perl module
PYTHONHOME                  = # the path to the python home
PYTHONPATH                  = # the path to the python path
LD_LIBRARY_PATH             = # the path to the python library


######################################################################
#
# Analysis parameters
#
#   If not defined, default values are going to be used in the pipeline.
#

##########
# parameters for bam2fastq
[bam2fastq]
qsub_option = -l s_vmem=1G,mem_req=1G

##########
# parameters for split fastq
[split_fastq]
qsub_option = -l s_vmem=1G,mem_req=1G
split_fastq_line_number = 40000000
fastq_filter = False

##########
# parameters for bwa_mem
[bwa_mem]
qsub_option = -l s_vmem=10.6G,mem_req=10.6G
bwa_params = -T 0

##########
## BAM markduplicates
[markduplicates]
qsub_option = -l s_vmem=10.6G,mem_req=10.6G
java_memory = 10.6G

##########
# BAM file statistics
[qc_bamstats]
qsub_option = -l s_vmem=1G,mem_req=1G

[qc_coverage]
qsub_option = -l s_vmem=1G,mem_req=1G
coverage    = 2,10,20,30,40,50,100
wgs_flag = False
wgs_incl_bed_width = 1000000
wgs_i_bed_lines = 10000
wgs_i_bed_width = 100

[qc_merge]
qsub_option = -l s_vmem=1G,mem_req=1G

###########
# mutation call
[mutation_call]
qsub_option = -l s_vmem=5.3G,mem_req=5.3G

[fisher_mutation_call]
# 変異ポジションのリード数が指定した数以下であれば候補の対象となりません.Tumor Normalともに指定した本数以上なければなりません.
min_depth = 8
# mapping qualityが指定した値以下であればその情報は使用されません.
map_quality = 20
# base qualityが指定した値以下であればその情報は使用されません.
base_quality = 15
# Tumorのvariant readがこの値以上でなければ候補の対象となりません.
min_variant_read = 4
# Tumorのアレル比がこの値以下であれば候補の対象となりません.
disease_min_allele_frequency = 0.02
# Normalのallele比がこの値以上であれば候補の対象となりません.
control_max_allele_frequency = 0.1
# Fihser検定による結果の閾値です.
fisher_thres_hold = 0.1
# 変異アレルのリード数は二項分布でモデル化できますが,これをベイズ的にやろうとしてベータ分布を利用し,その結果の10% posterio quantileを閾値としています.
post_10_q = 0.02
# fisher_thres_holdとの違いは,こちらの値は変異コールの結果のrawデータであるmutation.result.txtからmutation.result.filt.txtというフィルタ済みファイルを生成する際に使用されます.
fisher_pval-log10_thres = 1.0
# post_10_qとの違いは,こちらの値はフィルタ済み結果ファイルを生成する際に使用されます.
post_10_q_thres = 0.1

[realignment_filter]
# Tumorの変異数が指定した値以上であれば,フィルタ済み結果ファイルに出力されます
disease_min_mismatch=4
# Normalの変異数が指定した値以下であれば,フィルタ済み結果ファイルに出力されます
control_max_mismatch=2
# リードリアライメント時にはマルチアライメントしているのですが,1番目に良いスコアと2番目に良いスコアの差が指定した値以内であったら,そのリードを使用しないという設定です
score_diff=5
# リアライメントするときのリファレンスゲノムを作るときの設定ですwindow size(bases) + 変異サイズ + window size(bases)のリファレンスゲノムを作っています.
window_size=200
# 対象の変異positionがこの値以上であればリアライメント対象となりません.
max_depth=5000
# こちらの値は変異コールの結果のrawデータであるmutation.result.txtからmutation.result.filt.txtというフィルタ済みファイルを生成する際に使用されます.
fisher_pval-log10_thres = 1.0
# こちらの値はフィルタ済み結果ファイルを生成する際に使用されます.
post_10_q_thres = 0.1

[indel_filter]
# indelを検索するときの範囲を指定します search_length(bases) + 変異サイズ + search_length(bases)の範囲で探しに行きます.
search_length=40
# 探し出したindelが候補のポジションから指定した値の範囲内にいればindelフィルタの対象とします.
neighbor=5
# samtools mpileupをつかって,indelを検索するのですが,mpileupのオプションである-qの値となります.deletionの場合はbase qualityは無視されます.
base_quality=20
#depthと書かれている場合は変異ポジションのリード数の閾値になります.
min_depth=8
max_mismatch=100000
max_allele_freq=1

[breakpoint_filter]
max_depth=1000
# ソフトクリッピングの長さが指定した値以下であればその情報は使用されません.
min_clip_size=20
junc_num_thres=0
# mapping qualityが指定した値以下であればその情報は使用されません.
map_quality=10

[eb_filter]
# mapping qualityが指定した値以下であればその情報は使用されません.
map_quality = 20
# base qualityが指定した値以下であればその情報は使用されません.
base_quality = 15
# こちらの値はフィルタ済み結果ファイルを生成する際に使用されます.
ebcall_pval-log10_thres = 4.0

[annotation]
# annovarを使用するにはこのflagをTrueにしてください.
active_annovar_flag = False
# annovarのオプションを変更することができます.
table_annovar_params = -buildver hg19 -remove --otherinfo -protocol refGene,cytoBand,genomicSuperDups,esp6500siv2_all,1000g2010nov_all,1000g2014oct_all,1000g2014oct_afr,1000g2014oct_eas,1000g2014oct_eur,snp131,snp138,snp131NonFlagged,snp138NonFlagged,cosmic68wgs,cosmic70,clinvar_20150629,ljb26_all -operation g,r,r,f,f,f,f,f,f,f,f,f,f,f,f,f,f
# HGVDを使用するにはこのflagをTrueにしてください.
active_HGVD_flag = False

[mutation_merge]
qsub_option = -l s_vmem=2G,mem_req=2G

##########
## Genomon SV

[sv_parse]
qsub_option = -l s_vmem=2G,mem_req=2G
params =

[sv_merge]
qsub_option = -l s_vmem=2G,mem_req=2G
params =

[sv_filt]
qsub_option = -l s_vmem=2G,mem_req=2G
params = --min_junc_num 2 --max_control_variant_read_pair 10 --min_overhang_size 30
annotation_dir = # the path to the GenomonSV-0.4.0beta/resource
sv_utils_params = --min_tumor_allele_freq 0.07 --max_control_variant_read_pair 1 --control_depth_thres 10 --inversion_size_thres 1000 --remove_simple_repeat
sv_utils_annotation_dir = # the path to the sv_utils-0.4.0beta/resource

##########
## Post Analysis
[pa_plot]
# paplotを使用しない場合はFalse
enable = True
# ペアを設定していないサンプルをpaplotの対象から除く場合はFalse
include_unpair = True
# コントロールパネルを使用しないサンプルをpaplotの対象から除く場合はFalse
include_unpanel = True
title = Genomon
remarks = Data used in this report were generated using below software.
software = genomon_pipeline:Genomon-Pipeline, genomon_sv:GenomonSV, sv_utils:sv_utils, fisher:GenomonFisher, mutfilter:GenomonMutationFilter, ebfilter:EBFilter, mutanno:mutanno, mutil:mutil
config_file = # the path to the paplot-0.2.8/paplot.cfg
qsub_option = -l s_vmem=2G,mem_req=2G

[post_analysis]
# Genomon Post Analysisを使用しない場合はFalse
enable = True
config_file = # the path to the GenomonPostAnalysis-1.0.2/genomon_post_analysis.cfg
qsub_option = -l s_vmem=2G,mem_req=2G