目的 组学数据信息多样且体量庞大,变量间关系错综复杂.相关分析有助于在海量数据间找到有效关联对,是转化医学和系统生物学研究中常用手段之一.元基因组学和代谢组学2大组学平台由于具备整体系统性分析的功能,广泛应用到了菌群和代谢物的相关研究中.元基因组学和代谢组学数据的来源、结构和特点各不相同,需科学选取相关分析方法进行高质量跨组学研究.方法 选取4种典型的相关分析方法(2种经典方法和2种元基因组数据专用方法),设计仿真数据集和实验数据集,对各方法的性能进行测试和比较.结果 仿真和真实数据结果显示,CCLasso的相关系数最小,误差百分比最大,所找到的相关对数目最少;SparCC的结果与CCLasso相反;Pearson与Spearman结果介于两者之间,较为中立.结论 对于元基因组学与代谢组学数据的相关分析,CCLasso方法较为严格,易得到假阴性结果;SparCC方法较为宽松,易得到假阳性结果;Pearson和Spearman结果介于两者之间.建议研究者结合研究目标和侧重点确定具体方法.
作者:游懿君;梁丹丹;陈天璐
来源:转化医学杂志 2018 年 7卷 2期