精品文档---下载后可任意编辑1
简介(Introduction)通过高通量测序识别发现 de novo 的 somatic 和 germ line 突变,结构变异-SNV,包括重排突变(deletioin, duplication 以及 copy number variation)以及 SNP 的座位;针对重排突变和 SNP 的功能性进行综合分析;我们将分析基因功能(包括 miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与 mutation 之间的关系;以及这些关系将怎样使得在 disease(cancer)genome 中的 mutation 产生对应的易感机制和功能
我们将在基因组学以及比较基因组学,群体遗传学综合层面上深化探究疾病基因组和癌症基因组
实验设计与样本(1)Case-Control 对比组设计;(2)家庭成员组设计:父母-子女组(4 人、3 人组或多人);初级数据分析1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads 统计,测序深度分析
2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列
3.SNP 检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的 SNP 数据集
并根据参考基因组信息对检测到的变异进行注释
4.InDel 检测及在基因组的分布: 在进行 mapping 的过程中,进行容 gap 的比对并检测可信的 short InDel
在检测过程中,gap 的长度为 1~5 个碱基
对于每个 InDel 的检测,至少需要 3 个 Pai