您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定
收藏 | 浏览268 | 下载111

目的:应用随机森林模型和Logistic回归模型,研究糖尿病的风险因素并构建风险预测模型.数据来源于全国13家三甲医院的调查数据和体检数据,选取包括年龄、体重指数、糖尿病病史、腰围、舒张压、收缩压等因素在内的初始备选指标共17个,响应变量为餐后两小时血糖.方法:应用随机森林算法和Logistic回归,比较两种模型的预测效果.结果:在随机森林模型的变量重要性评分中,糖尿病病史、体重指数、年龄、收缩压以及腰围这几个特征变量得分较高;Logistic回归模型中糖尿病病史情况以及体重指数对模型影响较大,结果显示随机森林模型的预测效果略优于Logistic回归模型.结论:研究随机森林算法分析结果给出了各个因素指标的重要性评分,其结果可以应用于糖尿病高风险人群的筛查和风险干预措施的指导,从而可以大大提高人群中未诊糖尿病的检出率,增强糖尿病防治效果,并可节省大量的卫生资源.

作者:肖辉;郝元涛;徐晓;朱晓宇

来源:中国数字医学 2018 年 13卷 1期

知识库介绍

临床诊疗知识库该平台旨在解决临床医护人员在学习、工作中对医学信息的需求,方便快速、便捷的获取实用的医学信息,辅助临床决策参考。该库包含疾病、药品、检查、指南规范、病例文献及循证文献等多种丰富权威的临床资源。

详细介绍
热门关注
免责声明:本知识库提供的有关内容等信息仅供学习参考,不代替医生的诊断和医嘱。

收藏
| 浏览:268 | 下载:111
作者:
肖辉;郝元涛;徐晓;朱晓宇
来源:
中国数字医学 2018 年 13卷 1期
标签:
糖尿病 随机森林算法 Logistic回归 风险预测 diabetes random forest algorithm logistic regression risk prediction
目的:应用随机森林模型和Logistic回归模型,研究糖尿病的风险因素并构建风险预测模型.数据来源于全国13家三甲医院的调查数据和体检数据,选取包括年龄、体重指数、糖尿病病史、腰围、舒张压、收缩压等因素在内的初始备选指标共17个,响应变量为餐后两小时血糖.方法:应用随机森林算法和Logistic回归,比较两种模型的预测效果.结果:在随机森林模型的变量重要性评分中,糖尿病病史、体重指数、年龄、收缩压以及腰围这几个特征变量得分较高;Logistic回归模型中糖尿病病史情况以及体重指数对模型影响较大,结果显示随机森林模型的预测效果略优于Logistic回归模型.结论:研究随机森林算法分析结果给出了各个因素指标的重要性评分,其结果可以应用于糖尿病高风险人群的筛查和风险干预措施的指导,从而可以大大提高人群中未诊糖尿病的检出率,增强糖尿病防治效果,并可节省大量的卫生资源.