RNA-Seq 名词解释1
index测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品
碱基质量值(Quality Score 或 Q-score)是碱基识别(Base Calling)出错的概率的整数映射
碱基质量值越高表明碱基识别越可靠,碱基测错的可能性越小
Q30碱基质量值为 Q30 代表碱基的精确度在 99
FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)每 1 百万个 map 上的 reads 中 map 到外显子的每 1K 个碱基上的 fragment 个数
计算公式为公式中,cDNA Fragments 表示比对到某一转录本上的片段数目,即双端 Reads 数目;Mapped Reads(Millions)表示 Mapped Reads 总数,以 10 为单位;Transcript Length(kb):转录本长度,以 kb 个碱基为单位
FC(Fold Change)即差异表达倍数
FDR(False Discovery Rate)即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝的原假设个数的比例的期望值
通过控制 FDR 来决定 P 值的阈值
P 值(P-value)即概率,反映某一事件发生的可能性大小
统计学根据显著性检验方法所得到的 P 值,一般以P