目的 基于随机森林算法分析肺癌的影响因素并构建预测模型,为肺癌高危人群的筛查提供临床依据和技术支持.方法 选取2022年3-12月在安徽医科大学第一附属医院普胸外科住院且完成问卷调查的153例肺癌患者作为肺癌组,采用病例对照研究设计的方法,按1:2的比例选取同期收治的306例非肿瘤患者作为对照组.采用问卷调查法调查两组的人口学特征及相关资料,通过单因素及多因素logistic回归分析肺癌的影响因素并建立预测模型,采用随机森林算法对各变量的重要性进行排序.结果 单因素分析显示,两组患者的性别、年龄、相关症状(长期气喘、反复胸痛、长期咳嗽或咳痰)、慢性气管炎史、肺癌家族史、饮食习惯(过快饮食、过饱饮食、不规律饮食)、饮酒史、吸烟史、经常熬夜、规律体育锻炼、接触史(长期接触粉尘或棉尘、长期接触煤烟)、性格易怒等情况比较差异有显著性(P<0.05).多因素logistic回归分析显示,长期咳嗽或咳痰(OR=5.136,P<0.05)、肺癌家族史(OR=0.400,P<0.05)、过饱饮食(OR=3.814,P<0.05)、不规律饮食(OR=5.876,P<0.05)、吸烟史(OR=6.036,P<0.05)、长期接触粉尘或棉尘(OR=5.556,P<0.05)、性格易怒(OR=5.481,P<0.05)是肺癌的独立影响因素.基于logistic回归分析结果构建随机森林模型,其预测肺癌发生风险的RO
作者:董江燕;章靓;张静;郭文霞;骆乐;谭月霞
来源:中国医刊 2023 年 58卷 11期