目的:结合应用加权基因共表达网络分析(WGCNA)和差异基因表达分析2种方法筛选结肠癌mRNA表达谱中的差异共表达基因,并分析差异共表达基因与预后的关系。方法:基于生物信息学方法从癌症基因组图谱(TCGA)和基因表达综合(GEO)数据库分别下载TCGA结肠腺癌数据集的转录组学数据和GSE68468数据集的芯片表达谱数据,筛选出两者在正常组织与结肠癌组织之间的差异表达基因(DEG)和最显著相关的加权基因模块,通过差异基因和加权基因取交集筛选出结肠癌相关差异共表达基因。构建蛋白质-蛋白质相互作用(PPI )网络,利用最大派系中心度(MCC)计算方法筛选出MCC评分排名前10位的核心差异共表达基因,使用TCGA结肠腺癌数据集验证核心基因在正常组织和结肠癌组织中的表达,采用Kaplan-Meier生存分析探索核心基因与患者总生存期和无病生存期之间的关系。使用人类蛋白质图谱(HPA)数据库,对生存相关的差异共表达基因进行免疫组织化学染色验证。结果:TCGA结肠腺癌数据集中DEG共3 481个,GSE68468数据集中DEG共7 275个,共获得237个差异共表达基因。使用PPI网络的MCC计算方法得到10个核心的差异共表达基因,分别为氯离子通道附件1(
CLCA1)、
MAPK3、胰高血糖素(
GCG)、溶质载体家族26成员3(
SLC26
作者:张泽鑫;吴汶丰;李菁;简小兰;于奕
来源:中华消化杂志 2021 年 41卷 5期