您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定
收藏 | 浏览232 | 下载0

目的 针对体检数据的高维度、高冗余特点,对体检数据进行Lasso特征选择,为高维体检数据减少数据冗余提供方法学参考.方法 以代谢综合征为切入点,收集乌鲁木齐某体检中心2016年体检者信息共34981例,每位体检者信息包含75个变量.Lasso算法用于筛选体检中与代谢综合征强相关的变量.以F值、几何均数、ROC曲线下面积作为评价指标,比较Lasso特征选择前后,决策树分类体检中的代谢综合征患者的性能.结果 Lasso特征选择后,体检变量降至34个与代谢综合征强先关的炎性因子.Lasso特征选择后,C4.5决策树的分类性能提高.结论 建议在对体检高维数据分类前,运用Lasso进行特征选择,减少数据冗余,同时提高分类算法性能.

作者:闫慈;田翔华;阿拉依·阿汗;张伟文;曹明芹

来源:公共卫生与预防医学 2017 年 28卷 6期

知识库介绍

临床诊疗知识库该平台旨在解决临床医护人员在学习、工作中对医学信息的需求,方便快速、便捷的获取实用的医学信息,辅助临床决策参考。该库包含疾病、药品、检查、指南规范、病例文献及循证文献等多种丰富权威的临床资源。

详细介绍
热门关注
免责声明:本知识库提供的有关内容等信息仅供学习参考,不代替医生的诊断和医嘱。

收藏
| 浏览:232 | 下载:0
作者:
闫慈;田翔华;阿拉依·阿汗;张伟文;曹明芹
来源:
公共卫生与预防医学 2017 年 28卷 6期
标签:
Lasso 特征选择 体检 代谢综合征 分类 Lasso Feature selection Physical examination Metabolism syndrome Classification
目的 针对体检数据的高维度、高冗余特点,对体检数据进行Lasso特征选择,为高维体检数据减少数据冗余提供方法学参考.方法 以代谢综合征为切入点,收集乌鲁木齐某体检中心2016年体检者信息共34981例,每位体检者信息包含75个变量.Lasso算法用于筛选体检中与代谢综合征强相关的变量.以F值、几何均数、ROC曲线下面积作为评价指标,比较Lasso特征选择前后,决策树分类体检中的代谢综合征患者的性能.结果 Lasso特征选择后,体检变量降至34个与代谢综合征强先关的炎性因子.Lasso特征选择后,C4.5决策树的分类性能提高.结论 建议在对体检高维数据分类前,运用Lasso进行特征选择,减少数据冗余,同时提高分类算法性能.