您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定
收藏 | 浏览0 | 下载0

目的:探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用传统的非机器学习统计方法[Bayes 判别、Fisher 判别、偏最小二乘判别分析(PLS-DA)]和机器学习方法[随机森林(RF)、支持向量机(SVM)]进行统计分析,比较分类准确率的变化;最后用两个实例分析对模拟结果的合理性进行评价。结果代谢组学数据正态性对 Bayes 判别、Fisher 判别、PLS-DA 的分析结果影响较大,随着数据中服从正态分布的变量个数增加,分类准确率增大,而对 RF 和 SVM 基本没有影响。结论传统的非机器学习方法在统计分析过程中对数据正态性有一定的要求,而机器学习类的方法对数据正态性基本没有要求,且分类准确率一直保持较高的稳定状态。

作者:公晓云;申小涛;徐静;张涛;朱正江;薛付忠

来源:山东大学学报(医学版) 2016 年 54卷 4期

知识库介绍

临床诊疗知识库该平台旨在解决临床医护人员在学习、工作中对医学信息的需求,方便快速、便捷的获取实用的医学信息,辅助临床决策参考。该库包含疾病、药品、检查、指南规范、病例文献及循证文献等多种丰富权威的临床资源。

详细介绍
热门关注
免责声明:本知识库提供的有关内容等信息仅供学习参考,不代替医生的诊断和医嘱。

收藏
| 浏览:0 | 下载:0
作者:
公晓云;申小涛;徐静;张涛;朱正江;薛付忠
来源:
山东大学学报(医学版) 2016 年 54卷 4期
标签:
数据正态性 分类准确率 Bayes 判别 Fisher 判别 偏最小二乘判别分析 随机森林 支持向量机 Data Normality Classification Accuracy Bayes Discrimination Fisher Discrimination Partial Least Squares Discrimination Analysis Random Forest Support Vector Machine
目的:探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用传统的非机器学习统计方法[Bayes 判别、Fisher 判别、偏最小二乘判别分析(PLS-DA)]和机器学习方法[随机森林(RF)、支持向量机(SVM)]进行统计分析,比较分类准确率的变化;最后用两个实例分析对模拟结果的合理性进行评价。结果代谢组学数据正态性对 Bayes 判别、Fisher 判别、PLS-DA 的分析结果影响较大,随着数据中服从正态分布的变量个数增加,分类准确率增大,而对 RF 和 SVM 基本没有影响。结论传统的非机器学习方法在统计分析过程中对数据正态性有一定的要求,而机器学习类的方法对数据正态性基本没有要求,且分类准确率一直保持较高的稳定状态。