RNA-Seq 名词解释1.index测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。2.碱基质量值(Quality Score 或 Q-score)是碱基识别(Base Calling)出错的概率的整数映射。碱基质量值越高表明碱基识别越可靠,碱基测错的可能性越小。3.Q30碱基质量值为 Q30 代表碱基的精确度在 99.9%。4.FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)每 1 百万个 map 上的 reads 中 map 到外显子的每 1K 个碱基上的 fragment 个数。计算公式为公式中,cDNA Fragments 表示比对到某一转录本上的片段数目,即双端 Reads 数目;Mapped Reads(Millions)表示 Mapped Reads 总数,以 10 为单位;Transcript Length(kb):转录本长度,以 kb 个碱基为单位。5.FC(Fold Change)即差异表达倍数。6.FDR(False Discovery Rate)即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝的原假设个数的比例的期望值。通过控制 FDR 来决定 P 值的阈值。7.P 值(P-value)即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的 P 值,一般以P<0.05 为显著,P<0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于 0.05 或 0.01。8.可变剪接(Alternative splicing)有些基因的一个 mRNA 前体通过不同的剪接方式(选择不同的剪接位点)产生不同的 mRNA 剪接异构体,这一过程称为可变剪接(或选择性剪接,alternative splicing)。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致真核生物基因和蛋白质数量较大差异的重要原因。在生物体内,主要存在 7 种可变剪接类型:A)Exon skipping;B)Intron retention;C) Alternative 5' splice site;D) Alternative 3' splice site;E) Alternative first exon;F) Alternativelast exon;G) Mutually exclusive exon。9.外显子跳跃(Exon skipping)外显子在前体 mRNA 剪接形成成熟 mRNA 过程中被跳过,最终没有出现在某些成熟 mRNA 上,这种剪接机制被称为外显子跳跃。10. 内含子保留(Intron retention)前体 mRNA 在剪接形成成熟 mRNA 的过程中,部分内含子被保留下来,这种剪接机制被称为内含子保留。11. 5'或 3'端可变剪接前体 mRNA 在剪接形成成熟 mRNA 的过程中,5'端...