admin管理员组文章数量:1033328
基准测试:DeepVariant进行WES变异检测
本文以人 WES 测序数据为例,演示 DeepVariant 软件进行变异检测的基准测试过程。
工具地址:
usegalaxy 网站,搜索工具:DeepVariant
数据下载
瓶中基因组基准数据
我们将使用瓶中基因组小变异基准数据集 v4.2.1 对 HG003 样本进行基准测试。
代码语言:javascript代码运行次数:0运行复制mkdir -p benchmark
FTPDIR=.2.1/GRCh38
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz.tbi > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz.tbi
HG003 BAM
代码语言:javascript代码运行次数:0运行复制mkdir -p input
HTTPDIR=
curl ${HTTPDIR}/HG003.novaseq.wes_idt.100x.dedup.bam > input/HG003.novaseq.wes_idt.100x.dedup.bam
curl ${HTTPDIR}/HG003.novaseq.wes_idt.100x.dedup.bam.bai > input/HG003.novaseq.wes_idt.100x.dedup.bam.bai
捕获目标 BED 文件
在本案例研究中,我们将使用idt_capture_novogene.grch38.bed作为捕获目标 BED 文件。为了进行评估,hap.py将使该 BED 与 GIAB 置信区域相交。
代码语言:javascript代码运行次数:0运行复制HTTPDIR=
curl ${HTTPDIR}/idt_capture_novogene.grch38.bed > input/idt_capture_novogene.grch38.bed
参数设置
- • 参考基因组来源:GRCh38
- • BAM 文件:HG003.novaseq.wes_idt.100x.dedup.bam
- • 模型类型:WES
- • 选择特定区域进行处理
- • BED 文件:idt_capture_novogene.grch38.bed
基准测试
安装 hap.py
从网站 .py 下载测试软件。
测试
代码语言:javascript代码运行次数:0运行复制hap.py \
../benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz \
deepvariant.vcf \
-f ../benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed \
-T ../input/idt_capture_novogene.grch38.bed \
-r /path/to/Homo_sapiens_assembly38.fasta \
-o benchmark \
--pass-only
结果
评估摘要:
- • INDEL 真阳性率:0.9705,精确性:0.9914
- • SNP 真阳性率:0.9884,精确性:0.9975
计算效率
- • 4 线程:耗时 51 分钟,内存占用 13.3 GB。
- • 8 线程:耗时 24 分钟,内存占用 14.7 GB。
参考资料
.8/docs/deepvariant-exome-case-study.md
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-01,如有侵权请联系 cloudcommunity@tencent 删除数据线程测试工具内存基准测试:DeepVariant进行WES变异检测
本文以人 WES 测序数据为例,演示 DeepVariant 软件进行变异检测的基准测试过程。
工具地址:
usegalaxy 网站,搜索工具:DeepVariant
数据下载
瓶中基因组基准数据
我们将使用瓶中基因组小变异基准数据集 v4.2.1 对 HG003 样本进行基准测试。
代码语言:javascript代码运行次数:0运行复制mkdir -p benchmark
FTPDIR=.2.1/GRCh38
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz
curl ${FTPDIR}/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz.tbi > benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz.tbi
HG003 BAM
代码语言:javascript代码运行次数:0运行复制mkdir -p input
HTTPDIR=
curl ${HTTPDIR}/HG003.novaseq.wes_idt.100x.dedup.bam > input/HG003.novaseq.wes_idt.100x.dedup.bam
curl ${HTTPDIR}/HG003.novaseq.wes_idt.100x.dedup.bam.bai > input/HG003.novaseq.wes_idt.100x.dedup.bam.bai
捕获目标 BED 文件
在本案例研究中,我们将使用idt_capture_novogene.grch38.bed作为捕获目标 BED 文件。为了进行评估,hap.py将使该 BED 与 GIAB 置信区域相交。
代码语言:javascript代码运行次数:0运行复制HTTPDIR=
curl ${HTTPDIR}/idt_capture_novogene.grch38.bed > input/idt_capture_novogene.grch38.bed
参数设置
- • 参考基因组来源:GRCh38
- • BAM 文件:HG003.novaseq.wes_idt.100x.dedup.bam
- • 模型类型:WES
- • 选择特定区域进行处理
- • BED 文件:idt_capture_novogene.grch38.bed
基准测试
安装 hap.py
从网站 .py 下载测试软件。
测试
代码语言:javascript代码运行次数:0运行复制hap.py \
../benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark.vcf.gz \
deepvariant.vcf \
-f ../benchmark/HG003_GRCh38_1_22_v4.2.1_benchmark_noinconsistent.bed \
-T ../input/idt_capture_novogene.grch38.bed \
-r /path/to/Homo_sapiens_assembly38.fasta \
-o benchmark \
--pass-only
结果
评估摘要:
- • INDEL 真阳性率:0.9705,精确性:0.9914
- • SNP 真阳性率:0.9884,精确性:0.9975
计算效率
- • 4 线程:耗时 51 分钟,内存占用 13.3 GB。
- • 8 线程:耗时 24 分钟,内存占用 14.7 GB。
参考资料
.8/docs/deepvariant-exome-case-study.md
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2025-04-01,如有侵权请联系 cloudcommunity@tencent 删除数据线程测试工具内存本文标签: 基准测试DeepVariant进行WES变异检测
版权声明:本文标题:基准测试:DeepVariant进行WES变异检测 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://it.en369.cn/jiaocheng/1748023123a2242802.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论