目的 利用生物信息学技术,分析和处理相关高通量数据,查找或建立丙型病毒性肝炎导致肝癌发生相关的基因、蛋白质调控网络以及pathway功能注释信息,建立肝癌蛋白质网络,从而阐释丙型病毒性肝炎相关性肝癌动态发展机制.方法 通过文本挖掘技术对数据收集及整理,利用倍数变化(FC)方法对GEO数据库中肝癌相关3组基因表达谱芯片进行分析,计算差异表达基因,得到和肝癌相关的数据信息.从GEO数据库中获取两组基因表达谱芯片,利用FC方法得到肝癌阶段的异常表达基因集,再将得到的基因集投射到蛋白质相互作用关系,以得到相应的蛋白质网络.结果 GEO数据库中收集到19张正常组芯片、29张丙型病毒性肝炎肝硬化芯片和16张丙型病毒性肝炎肝硬化伴肝癌芯片,利用FC方法得到肝硬化阶段差异基因1 404个,肝癌阶段1 129个.对基因集进行了GO、Pathway功能注释富集分析以说明其内在含义并验证疾病相关基因收集的结果.利用收集的数据建立了肝癌发生发展过程中的蛋白质相互作用动态网络.结论 利用文本挖掘及生物信息学技术收集了肝癌相关基因和蛋白数据,并建立了肝癌发展过程中的动态蛋白质网络.
作者:汪炳瑞;刘卓然;杨卫平;沈柏用;彭承宏;邱伟华
来源:中华实验外科杂志 2015 年 32卷 10期