您的账号已在其他设备登录,您当前账号已强迫下线,
如非您本人操作,建议您在会员中心进行密码修改

确定
收藏 | 浏览173 | 下载20

目的 结合Rstudio和Random Jungle两款软件的优势,通过远程登录简便、快捷地实现全基因组学数据的分析.方法 在服务器端搭建Rstudio Server,封装随机丛林R程序并对英国威康信托病例对照协会(WTCCC)高血压真实数据进行分析,通过Rstudio Sweave动态生成分析结果.结果 在客户端即可通过网络浏览器登陆服务器端搭建好的Rstudio Server;数据量较大时,封装后的随机丛林程序在Rstudio Server中运算速度方面相对于R randomForest包优势明显.2001名高血压病例及3004名对照的22条染色体共有490032个SNP位点,根据真实标签通过10次随机丛林过程筛选出稳定排序在前20位的SNPs位点,其Cochron-Armitage检验的P值也有10个排进前11位.结论 全基因组学数据的处理会消耗很多的时间和内存,普通计算机根本无法承受,Random Jungle软件的命令行运行方式又不易于数据处理、算法组合或嵌套及结果的再现、可视化,在服务器端搭建Rstudio Server并结合Random Jungle的分析策略可有效地应用于全基因组学数据分析,简化分析过程、提高分析速度和效率、方便实现分析结果的动态输出及再现.

作者:顾星博;李昂;温琪;焦辛妮;刘艳

来源:中国卫生统计 2015 年 32卷 6期

知识库介绍

临床诊疗知识库该平台旨在解决临床医护人员在学习、工作中对医学信息的需求,方便快速、便捷的获取实用的医学信息,辅助临床决策参考。该库包含疾病、药品、检查、指南规范、病例文献及循证文献等多种丰富权威的临床资源。

详细介绍
热门关注
免责声明:本知识库提供的有关内容等信息仅供学习参考,不代替医生的诊断和医嘱。

收藏
| 浏览:173 | 下载:20
作者:
顾星博;李昂;温琪;焦辛妮;刘艳
来源:
中国卫生统计 2015 年 32卷 6期
标签:
全基因组关联分析 SNPs Rstudio 随机森林 随机丛林 GWAS SNPs Rstudio Random Forest Random Jungle
目的 结合Rstudio和Random Jungle两款软件的优势,通过远程登录简便、快捷地实现全基因组学数据的分析.方法 在服务器端搭建Rstudio Server,封装随机丛林R程序并对英国威康信托病例对照协会(WTCCC)高血压真实数据进行分析,通过Rstudio Sweave动态生成分析结果.结果 在客户端即可通过网络浏览器登陆服务器端搭建好的Rstudio Server;数据量较大时,封装后的随机丛林程序在Rstudio Server中运算速度方面相对于R randomForest包优势明显.2001名高血压病例及3004名对照的22条染色体共有490032个SNP位点,根据真实标签通过10次随机丛林过程筛选出稳定排序在前20位的SNPs位点,其Cochron-Armitage检验的P值也有10个排进前11位.结论 全基因组学数据的处理会消耗很多的时间和内存,普通计算机根本无法承受,Random Jungle软件的命令行运行方式又不易于数据处理、算法组合或嵌套及结果的再现、可视化,在服务器端搭建Rstudio Server并结合Random Jungle的分析策略可有效地应用于全基因组学数据分析,简化分析过程、提高分析速度和效率、方便实现分析结果的动态输出及再现.