目的:探索转录因子(transcription factors, TFs)和结肠癌预后的联系,通过TCGA和GEO双数据库构建预后模型,从而量化患者的风险并指导临床治疗决策。方法:本研究运用TCGA和GEO数据库中结肠癌的转录组和临床数据,先将转录组数据进行基因注释并计算基因表达量,对TCGA和GEO中TFs行差异性分析(| log2FC| >1,P-Value(Fdr)<0.05)。取双数据交集的差异TFs行相关预后分析(
P<0.01)。利用COX多因素分析计算出预后相关TFs的风险系数和其风险值,应用"survival"和"glmnet"包进行COX模型构建TFs预后模型。绘制出序列集和验证集的生存曲线(
P<0.001)及ROC曲线(AUC>0.75),对风险值的分布进行可视化。按风险值分组后计算GSEA富集分析,构建基因集网格,进行靶基因预测,最后进行GO和KEGG的通路富集分析。
结果:取TCGA和GEO数据库两者交集的387个表达差异的TFs绘制热图,火山图及TFs相关的森林图,按照COX多因素分析构建出结肠癌预后模型=0.310×HSF4+0.137×IRX3-0.127× ATOH1+0.290×OVOL3+0.137×HOXC6+0.155×SIX2+0.092×ZNF556-0.444×CXXC5+0.429×TIGD1+0.413×TCF7L1。通过富集分析,结果显示这些预后因子可能直接或间接作用于癌通路,如基础细胞癌与癌症信号通路、局部组
作者:屈超;陈子璐;徐正水;赵晨野;叶长春;林文浩;郑见宝;余钧辉;赵伟;孙学军
来源:中华内分泌外科杂志 2022 年 16卷 3期