电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

GATK使用方法详解(原始数据的处理)

GATK使用方法详解(原始数据的处理)_第1页
1/17
GATK使用方法详解(原始数据的处理)_第2页
2/17
GATK使用方法详解(原始数据的处理)_第3页
3/17
GATK 使用方法详解(原始数据的处理) 1. 对原始下机 fastq 文件进行过滤和比对(mapping) 对 于 Illumina下 机 数 据 推 荐 使 用 bwa进 行 mapping。 Bwa比 对 步 骤 大 致 如 下 : ( 1) 对 参 考 基 因 组 构 建 索 引 : 例 子 : bwa index -a bwtsw hg19.fa。 最 后 生 成 文 件 : hg19.fa.amb、hg19.fa.ann、hg19.fa.bwt、hg19.fa.pac和 hg19.fa.sa。 构 建 索 引 时需要注意的问题: bwa构 建 索 引 有两种算法,两种算法都是基 于 BWT的,这两种算法通过参 数 -a is 和-a bwtsw进 行 选择。 其中-a bwtsw对 于 短的参 考 序列是不工作的,必须要大 于 等于 10Mb;-a is是默认参 数 ,这个参 数 不适用 于 大 的参 考 序列,必须要小于 等于2G。 ( 2) 寻找输入 reads文 件 的 SA坐标。 对 于 pair end数 据 ,每个 reads文 件 单独做运算,single end数 据 就不用 说了,只有一个文 件 。 例 子 : pair end: bwa aln hg19.fa read1.fq.gz -l 30 -k 2 -t 4 -I > read1.fq.gz.sai bwa aln hg19.fa read2.fq.gz -l 30 -k 2 -t 4 -I > read2.fq.gz.sai single end: bwa aln hg19.fa read.fq.gz -l 30 -k 2 -t 4 -I > read.fq.gz.sai 主 要 参 数 说 明 : -o int: 允 许 出 现 的 最 大 gap数 。 -e int: 每 个 gap允 许 的 最 大 长 度 。 -d int: 不 允 许 在 3’端出 现 大 于多少 bp的 deletion。 -i int: 不 允 许 在 reads两端出 现 大 于多少 bp的 indel。 -l int: Read前多少个 碱基作为 seed,如果设置的 seed大 于 read长 度 ,将无法继续,最 好设置在 25-35,与-k 2 配合使用。 -k int: 在 seed中的 最 大 编辑距离,使用默认 2,与-l配合使用。 -t int: 要 使用的 线程数 。 -R int: 此参 数 只应用于 pair end中,当没有出 现 大 于此值的 最 佳比对结果时,将会降低标准再次进行比对。 增加这个 值可以提高配对比对的 准确率,但是同时会消耗更长 的 时间,默认是 32。 -I int: 表示输入的 文件格式为 Illumina 1.3+数 据格式。 -B int: 设置标记序列。 从 5’端开始多少个 碱基作为标记序列,当-B为正值时,...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

GATK使用方法详解(原始数据的处理)

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部