利用 metaphlan2 结果计算 alpha 多样性利用 metaphlan2 结果计算 alpha 多样性前期回顾 结果展示 格式转化 什么是 α 多样性 什么是 Shannon 指数 Shannon 指数如何计算 前期回顾MetaPhlAn2 是分析微生物群落(细菌、古菌、真核生物和病毒)组成的工具,可以基于宏基因组数据,获得微生物群体中种水平精度的组成,包括细菌、古菌、真核生物和病毒。如果有株水平基因组的物种,也可以追踪和研究。MetaPhlAn2 整理了超过 17000 个参考基因组,包括 13500 个细菌和古菌,3500 个病毒和 110 种真核生物,汇编整理了 100 万+类群特异的标记基因,可以实现:精确的分类群分配准确估计物种的相对丰度种水平精度株鉴定与追踪超快的分析速度结果展示输出结果为各层级物种相对丰度值,但是这样的表格并不合适进行 α 多样性的分析SampleID Metaphlan2_Analysis_1 Metaphlan2_Analysis_2 Metaphlan2_Analysis_3 k Archaea|p Euryarchaeota|c Methanobacteria 0.31692 0 0.14969 k Archaea|p Euryarchaeota|c Methanococci 0 0.00208 0.00174 所以我们需要将 MetaPhlAn2 的结果转成 STAMP 的格式格式转化metaphlan_to_stamp.pl ./taxonomy.tsv > ./taxonomy.spf1以上程序可以在 https://github.com/LangilleLab/microbiome_helper 上下载到因为去掉了重复的分层注释,所以 STAMP 结果是Kingdom Phylum Class Metaphlan2_Analysis_1 Metaphlan2_Analysis_2 Metaphlan2_Analysis_3 k Archaea p Euryarchaeota c Methanobacteria 0.31692 0 0.14969 k Archaea p Euryarchaeota c Methanococci 0 0.00208 0.00174 什么是 α 多样性α-多样性(α-diversity)指局部区域的物种数量。什么是 Shannon 指数Shannon 指数,也称香浓指数,也是在 α 多样性分析中常见的概念, 在 1963 年由 Shannon 和 Wiener 首先提出来。Shannon 指数不只关心物种丰富度,而且同时关心物种的均匀度(Evenness),所以是对群落结构的更综合性的反应。它的具体算法是:H=-∑(Pi)(log2Pi)其中 Pi 是样品中属于第 i 种的个体的比例,如样品总个体数为 N,第 i 种个体数为 ni,则 Pi=ni/N。Shannon 指数的总体理念是为了预测下一个采集的物种是什么,因此它是对采集物种的不确定性进行分析。如果群落的多样性越高,那么下一个采集到物种的不确...