目的 基于 LASSO回归与随机森林算法分析 2 型糖尿病的发病风险因素,为临床决策提供参考.方法 以中国健康与养老追踪调查数据库 2011 年和 2015 年的数据进行队列研究,调查 45 岁及以上人群 2 型糖尿病的风险因素,共纳入3803 名研究对象.研究以人口学变量、生活习惯、血生化指标、2010-2015 年气象数据、空气质量监测数据为自变量,糖尿病结局为因变量,采用 LASSO回归与随机森林重要性排序进行特征变量选择,构建随机森林预测模型并进行效能评价.结果 经随机森林算法分析,空腹血糖、相对湿度、腰围、体质指数、黑碳、硝酸盐、风速、总胆固醇、温度和供暖燃料是 2 型糖尿病排名前 10 的重要危险因素.结合 LASSO 回归与随机森林变量重要性排序构建预测模型.经十折交叉验证,模型灵敏度为62.1
作者:苏宇腾;吕世云;谢文涵;李元;欧阳逸馨;薛咏茜;胡美玲;李舒婷;周航;刘相佟
来源:环境卫生学杂志 2023 年 13卷 7期