您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定
收藏 | 浏览235 | 下载20

目的 探讨基于肺癌全基因组关联研究数据的遗传风险预测方法和策略.方法 将肺癌GWAS数据中的南京子样本和北京子样本分别作为训练集和测试集,分别使用预测全集和最优预测子集两种策略,比较三种预测方法在不同连锁不平衡结构(UD)和初筛检验水准(α)下的预测准确度.结果 wGRS在高LD结构下,随着-log (α)增大,预测准确度呈现上升趋势;RF和SVM对LD结构不如wGRS敏感,但三种方法在低LD结构(r2<0.2)下预测准确度优于高LD结构;wGRS方法下最优预测子集效果略优于预测全集效果,SVM下子集效果与全集近似,但略逊于全集,RF下子集效果则不如全集,且差距较大.结论 基于LD结构修剪SNP位点和选择适当的初筛水准可以提高遗传风险预测准确度,此时wGRS方法预测效果优于SVM和RF.

作者:段巍巍;赵杨;张丽伟;胡志斌;陈峰

来源:中国卫生统计 2015 年 32卷 4期

知识库介绍

临床诊疗知识库该平台旨在解决临床医护人员在学习、工作中对医学信息的需求,方便快速、便捷的获取实用的医学信息,辅助临床决策参考。该库包含疾病、药品、检查、指南规范、病例文献及循证文献等多种丰富权威的临床资源。

详细介绍
热门关注
免责声明:本知识库提供的有关内容等信息仅供学习参考,不代替医生的诊断和医嘱。

收藏
| 浏览:235 | 下载:20
作者:
段巍巍;赵杨;张丽伟;胡志斌;陈峰
来源:
中国卫生统计 2015 年 32卷 4期
标签:
肺癌 遗传风险得分 支持向量机 随机森林 最优预测子集 单核苷酸多态性 Lung cancer Genetic risk score Support vector machine Random forest Best predictive subset Single nucleotide polymorphism
目的 探讨基于肺癌全基因组关联研究数据的遗传风险预测方法和策略.方法 将肺癌GWAS数据中的南京子样本和北京子样本分别作为训练集和测试集,分别使用预测全集和最优预测子集两种策略,比较三种预测方法在不同连锁不平衡结构(UD)和初筛检验水准(α)下的预测准确度.结果 wGRS在高LD结构下,随着-log (α)增大,预测准确度呈现上升趋势;RF和SVM对LD结构不如wGRS敏感,但三种方法在低LD结构(r2<0.2)下预测准确度优于高LD结构;wGRS方法下最优预测子集效果略优于预测全集效果,SVM下子集效果与全集近似,但略逊于全集,RF下子集效果则不如全集,且差距较大.结论 基于LD结构修剪SNP位点和选择适当的初筛水准可以提高遗传风险预测准确度,此时wGRS方法预测效果优于SVM和RF.