目的:探讨随机森林算法在产后抑郁影响因素的筛选和风险预测中的应用效果.方法:选取2017年6月至2018年6月在湖南省长沙市某三甲医院接受产前检查并在该医院分娩,符合纳入和排除标准的孕早期妇女为研究对象.入组时,使用自编的调查问卷、中文版爱丁堡产后抑郁量表(Edinburgh Postnatal Depression Scale,EPDS)调查研究对象的人口经济学、心理社会学、生物学和产科及其他特征;产后4~6周内,采用中文版EPDS进行抑郁评分和自编的产后资料问卷收集分娩和产后资料.采用R软件在训练数据集上建立产后抑郁风险预测的随机森林模型,在验证数据集上采用预测准确率、灵敏度、特异度、阳性预测值、阴性预测值和曲线下面积(area under curve,AUC)评价模型的预测效果.结果:共调查406例研究对象,其中150例的EPDS得分≥9,产后抑郁的发生率为36.9%.通过随机森林算法对训练集建立的模型在验证集上验证,得出预测准确度为80.10%,灵敏度为61.40%,特异度为89.10%,阳性预测值为73.00%,阴性预测值为82.80%,AUC值0.833.采用随机森林算法通过变量重要性评分对产后抑郁影响因素的重要程度进行排序,得出排名前10位的重要预测变量为产前抑郁、产后经济担忧程度、产后工作担忧程度、孕早期血清游离三碘甲腺原氨酸、孕晚期高密度脂蛋
作者:肖美丽;晏春丽;付冰;杨淑平;朱姝娟;杨东琪;雷倍美;黄瑞瑞;雷俊
来源:中南大学学报(医学版) 2020 年 45卷 10期