×

克鲁斯卡尔 沃利斯检验

克鲁斯卡尔 沃利斯检验(LDA Effect Size (LEfSe) Analysis(LEfSe丰度差异分析))

admin admin 发表于2023-10-22 23:24:31 浏览71 评论0

抢沙发发表评论

本文目录

LDA Effect Size (LEfSe) Analysis(LEfSe丰度差异分析)

LEfSe是一种用于发现高维生物标识和揭示基因组特征的软件。包括基因,代谢和分类,用于区别两个或两个以上生物条件(或者是类群)。该算法强调的是统计意义和生物相关性。让研究人员能够识别不同丰度的特征以及相关联的类别。

LEfSe通过生物学统计差异使其具有强大的识别功能。然后,它执行额外的测试,以评估这些差异是否符合预期的生物学行为。具体来说,首先使用non-parametric factorial Kruskal-Wallis (KW) sum-rank test(非参数因子克鲁斯卡尔—沃利斯和秩验检)检测具有显著丰度差异特征,并找到与丰度有显著性差异的类群。最后,LEfSe采用线性判别分析(LDA)来估算每个组分(物种)丰度对差异效果影响的大小。

LEfSe软件用于发现两组或两组以上的biomarker,主要是通过非参数因子Kruskal-Wallis秩和检验来实现的。 运行LEfSe软件主要分三大步骤:第一步:需要把普通的物种、基因等等的丰度信息的表格转化成LEfSe识别的格式。这一步会生成.in结尾的文件 第二步:这一步也是最关键的一步,统计显著差异的biomarker、统计子组组间差异、统计effect sizes(LDA score),会生成.res格式的文件。如下图所示 Step1:两组或两组以上的样本中采用的非参数因子Kruskal-Wallis秩和检验检测出biomarker。 Step2:基于上步的显著差异物种基因,进行两两组之间的Wilcoxon秩和检验,检测出组间差异。 Step3:线性判别分析(LDA)对biomarker进行评估差异显著的物种的影响力(即LDA score),最终获得biomarker。 第三步:基于第二大步的数据,绘制各种图片。

下图展示了LEfSe算法的工作原理:

输入:

LEfSe分析输入配置文件,可通过分析模块 " LEfSe formatting Generate Input config file for LEFSe Analysis" 得到。

输出:

LEfSe分析输出结果文件(表格文件):

**列为feature

第二列为各组分丰度平均值中**值的对数值(the logarithm value of the highest mean among all the classes)

如果feature在组间具有显著性差异,则,

第三列为平均值最高的组(the class with the highest mean)

第四列为the loga

文献如下所示: Chenhong Zhang, Shoufeng Li, Liu Yang, et al. Structural modulation of gut microbiota in life-long calorie-restricted mice. NATURE COMMUNICATIONS,4:2163,DOI:10.1038/ncomms3163(2013).

Segata N, Izard J, Waldron L, Gevers D, Miropolsky L et al. (2011) Metagenomic biomarker discovery and explanation. Genome Biol 12: R60.10.1186/gb-2011-12-6-r60 PubMed: 21702898.

SPSS中,kruskal-wallis H检验的两两比较怎么做

输入代码:

编秩:Transform》》RankCases…,DATA》》Variable(s)。

运行后在原数据中产生新变量:RDATA,即按照变量DATA值编秩后的新变量。

Analyxe》》CompareMeans》》

One-WayANOVA…,

RDATA》》DependentList

GROUP》》Factor。

扩展资料:

在10版以后,SPSS的每个新增版本都会对数据管理功能作一些改进,以使用户的使用更为方便。13版中的改进可能主要有以下几个方面:

1)超长变量名:在12版中,变量名已经最多可以为64个字符长度,13版中可能还要大大放宽这一限制,以达到对当今各种复杂数据仓库更好的兼容性。

2)改进的Autorecode过程:该过程将可以使用自动编码模版,从而用户可以按自定义的顺序,而不是默认的ASCII码顺序进行变量值的重编码。另外,Autorecode过程将可以同时对多个变量进行重编码,以提高分析效率。