下载后可任意编辑GATK 使用方法详解 plob 最详尽说明指导书下载后可任意编辑GATK 使用方法详解一、使用 GATK 前须知事项:(1)对 GATK 的测试主要使用的是人类全基因组和外显子组的测序数据,而且全部是基于 illumina 数据格式,目前还没有提供其他格式文件(如 Ion Torrent)或者实验设计(RNA-Seq)的分析方法
(2)GATK 是一个应用于前沿科学讨论的软件,不断在更新和修正,因此,在使用 GATK 进行变异检测时,最好是下载最新的版本,(2024-02-25)
(3)在 GATK 使用过程中(见下面图),有些步骤需要用到已知变异信息,对于这些已知变 异,GATK 只提供了人类的已知变异信息,可以在 GATK 的FTP 站点下载(GATK resource bundle)
假如要讨论的不是人类基因组,需要自行构建已知变异,GATK 提供了详细的构建方法
(4)GATK 在进行 BQSR 和 VQSR 的过程中会使用到 R 软件绘制一些图,因此,在运行 GATK 之前最好先检查一下是否正确安装了 R 和所需要的包,所需要的包大概包括 ggplot2、gplots、bitops、caTools、 colorspace、gdata、gsalib、reshape、RColorBrewer 等
假如画图时出现错误,会提示需要安装的包的名称
二、GATK 的使用流程GATK 最佳使用方案:共 3 大步骤,即:原始数据的处理 --> 变异检测 --> 初步分析
下载后可任意编辑原始数据的处理1
对原始下机 fastq 文件进行过滤和比对(mapping)对于 Illumina 下机数据推举使用 bwa 进行 mapping
Bwa 比对步骤大致如下:(1)对参考基因组构建索引:例子:bwa index -a bwtsw
构建索引时需要注