目的 利用癌症基因组图谱(TCGA)数据库的染色质开放性高通量测序(ATAC-seq)数据和转录组测序(RNA-seq)数据,探索染色质开放状态对结肠癌相关功能通路的影响.方法 从TCGA数据库下载结肠癌ATAC-seq数据和RNA-seq数据,使用R 3.5.3软件对ATAC-seq数据进行质量控制.对全部样本ATAC-seq数据峰值(peaks)进行基因注释,对所注释基因进行基因本体(GO)功能富集分析和京都基因与基因组百科全书(KEGG)通路富集分析.选择结肠癌关键基因肿瘤抑制基因APC(APC)、Kirsten大鼠肉瘤病毒癌基因(KRAS)、v-raf小鼠肉瘤病毒癌基因同源物B1(BRAF),对3个基因的启动子区ATAC-seq数据peaks与RNA-seq的每千个碱基的转录每百万映射读取的片段数(FPKM)进行Pearson相关性分析.对TNM分期Ⅲ+Ⅳ期和Ⅰ+Ⅱ期的组织样本进行差异ATAC-seq数据peaks分析,并对上调和下调peaks注释基因进行KEGG通路富集分析.结果 结肠癌ATAC-seq数据peaks在染色体分布均匀,大多数分布于启动子区(距离转录起始位点≤1 kb、>1~2 kb、>2~3 kb者分别占30.17%、5.42%、3.88%)和远端基因间区(26.17%),符合染色质开放区2种主要类型的分布.GO功能和KEGG通路富集分析结果显示,结肠癌ATAC-seq数据peaks注释基因显著富集于癌症相关功能和通路,如Wnt信号通路的细胞间信号
作者:康争春;闫飞虎;王振;赵子夜;于恩达;邢俊杰
来源:第二军医大学学报 2021 年 42卷 7期