引用本文: 何进程, 王军, 姜雷, 闵光涛, 姚南. 基于生物信息学分析 MET 基因过表达对胰腺癌患者预后的影响. 中国普外基础与临床杂志, 2021, 28(9): 1171-1176. doi: 10.7507/1007-9424.202012064 复制
胰腺癌是一种常见的恶性肿瘤,因其病程进展迅速及高侵袭性和高化学耐药的特点,胰腺癌的发病率和病死率在全球范围内均呈逐年递增趋势[1]。缺乏特异性肿瘤标志物作为早期筛查的手段和评价患者生存预后的指标,通常导致胰腺癌患者治疗延误[2]。因此,确立特异性生物标志物对于胰腺癌早期诊断和预后评价尤为重要。
胰腺癌的发生往往伴随多个基因的改变[3-4],而某些特殊基因异常表达可能是影响胰腺癌患者预后的重要因素,也有望成为个体化治疗的有效靶点[5]。近年来,随着测序技术的快速发展,高通量基因组学可有效挖掘在肿瘤发生发展中的关键基因,并进一步分析其与肿瘤发生发展的有关机制。本研究通过在基因表达综合(gene expression omnibus,GEO)数据库和癌症基因组图谱(the cancer genome atlas,TCGA)数据库下载胰腺癌基因芯片,筛选出与胰腺癌临床预后密切相关的关键基因即间充质上皮转化因子(mesenchymal epithelial transition factor,MET),并经基因表达谱交互分析(gene expression profiling interactive analysis,GEPIA)数据库进一步验证其在癌组织及其癌旁组织中的表达差异,探讨 MET 基因与胰腺癌发生有关的可能分子机制,以期作为胰腺癌预后评价的临床指标。
1 资料与方法
1.1 GEO 数据分析
在 GEO 数据库(
1.2 TCGA 数据分析
从 TCGA 数据库(
1.3 GO 和 KEGG 富集分析
使用 R 软件中的“clusterProfiler”“richplot”和“ggplot2”函数,对 DEGs 进行了基因本体论(gene ontology,GO)和京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)在线富集分析,其中仅有 P<0.05 且 FDR<0.05 的富集术语具有统计学差异。
1.4 GEPIA 数据库分析
通过 GEPIA 在线数据库(
1.5 统计学方法
采用 R(v.4.0.2)软件及 SPSS 26.0 软件对数据进行统计学分析。通过 Kolmogorov-Smirnov 检验 TCGA 数据库胰腺癌组织 MET 基因表达数据正态分布情况,结果显示符合正态分布,并使用 GraphPad Prism 7.0 软件绘制受试者工作特征(ROC)曲线。使用 R 软件 limma 包筛选 GSE28735 和 GSE62452 基因芯片数据集中胰腺癌组织与癌旁组织的 DEGs;采用 Wilcoxon 秩和检验分析胰腺癌临床病理特征与各基因表达量的关系,筛选临床相关性基因;采用 Pearson χ2 检验和连续校正法分析 MET 基因表达与胰腺癌患者临床病理特征的相关性;Kaplan-Meier 方法评估胰腺癌患者的总体生存情况;单因素 COX 回归分析 MET 基因表达及胰腺癌临床病理特征对患者预后的影响,并将 P<0.1 的变量纳入多因素 COX 回归分析。检验水准 α=0.05(双尾)。
2 结果
2.1 筛选胰腺癌关键基因
2.1.1 筛选胰腺癌癌组织及其癌旁组织中的 DEGs
以 |log2FC|>1 且 FDR<0.05(FC=肿瘤组织/癌旁组织)为筛选标准对 GSE28735 和 GSE62452 基因芯片进行基因差异表达分析,其结果显示:在 GSE28735 基因芯片中,有 240 个基因在胰腺癌组织中表达上调,171 个基因表达下调(图 1a);在 GSE62452 基因芯片中,有 180 个基因在胰腺癌组织中表达上调,114 个基因表达下调(图 1b)。

a:GSE28735 火山图;b:GSE62452 火山图;c:GSE28735 和 GSE62452 基因芯片的 DEGs 和 TCGA 临床相关基因整合后的韦恩图;d、e:示 GSE28735(d)和 GSE62452(e)基因芯片中 MET 基因在癌组织及其癌旁组织中的表达结果;f:GEPIA 数据库中胰腺癌组织及其癌旁组织中 MET 基因的表达;g、h:示 GSE28735(g)和 GSE62452(h)基因芯片中 MET 基因模拟诊断胰腺癌的 ROC 曲线;i:MET 基因模拟判断胰腺癌 5 年生存期的 ROC 曲线。火山图中 log2 FC 表示胰腺癌组织与癌旁组织中基因表达倍数的对数;–log(FDR)表示 FDR 法校正后的
2.1.2 筛选临床相关显著基因
对 TCGA 数据库中胰腺癌组织的基因芯片和胰腺癌临床病理特征(包括患者年龄、性别、肿瘤的组织学分级[6]、TNM 分期、T 分期以及 N 分期)进行相关性分析以筛选临床相关显著基因,结果共筛选到 103 个临床相关显著基因(P<0.05)。
2.1.3 筛选关键基因
使用 R 软件的“Venn Diagram”函数将差异表达显著基因与临床相关显著基因进行整合并可视化,其结果显示,在 GSE28735 和 GSE62452 基因芯片的差异表达基因中,有 281 个相同基因,提示这些基因可能与胰腺癌的发生发展具有密切关系;而差异表达显著基因且临床相关性较强的基因有 3 个(韦恩图,图 1c),分别为 MET、DEXD/H 盒解旋酶 60(DEXD/H box helicase 60,DDX60)和犬尿氨酸酶(kynureninase,KYNU)。本研究选择 MET 基因作为关键基因,进一步研究其表达对胰腺癌患者预后的影响。
2.2 MET 基因在胰腺癌组织及其癌旁组织中的表达情况
生物信息学分析结果显示:GSE28735 和 GSE62452 基因芯片中,MET 基因在胰腺癌组织中的表达量明显高于癌旁组织,其差异具有统计学意义(log2FC=1.28,P=2.0×10−9,FDR=1.64×10−9;log2FC=1.43,P=2.7×10−11,FDR=1.64×10−9),见图 1d、1e。在 GEPIA 在线数据库中,对 GEPIA 数据库中 179 例胰腺癌组织和 171 例癌旁组织样本的分析同样证实 MET 基因在胰腺癌组织中的表达量高于癌旁组织(P<0.001),见图 1f。为评估 MET 诊断胰腺癌的价值,本研究分别绘制了 GSE28735 和 GSE62452 基因芯片的 ROC 曲线,其结果显示, MET 基因模拟诊断胰腺癌的 ROC 曲线下面积(AUC)分别为 0.87 和 0.84,敏感度分别为 88.9% 和 73.9%,特异度分别为 82.2% 和 86.9%(图 1g、1h)。其结果提示 MET 可能是胰腺癌临床诊断有价值的生物标志物。
为了评估 MET 预测胰腺癌患者预后的价值,本研究以 5 年期的生存状态为结局变量,进一步绘制 ROC 曲线以分析 TCGA 数据库的 MET 基因表达数据,其结果显示,MET 基因模拟判断胰腺癌患者预后的 ROC 曲线下面积(AUC)为 0.72,最佳临界值(Cut-off)为 16.6,敏感度为 73.9%,特异度为 60.3%。见图 1i。
2.3 胰腺癌组织中 MET 基因表达与其临床病理特征的相关性分析结果
本研究将 TCGA 数据库 177 例胰腺癌组织样本筛选后得到 168 例临床信息完整的基因表达数据。通过与 MET 基因表达中位值比较将肿瘤样本分为高、低表达组,进一步 分析其 MET 基因的表达水平与胰腺癌临床病理特征的关系,结果显示 MET 基因的表达水平与患者年龄、T 分期和肿瘤的组织学分级(Grade)有关(P<0.05),与患者性别、TNM 分期和 N 分期无明显相关性(P>0.05),见表 1。

2.4 MET 基因表达对胰腺癌患者预后的影响
本研究将 TCGA 数据库预处理的 177 例胰腺癌样本整理后得到 176 例生存信息完整的 MET 基因表达数据,通过中位值将 MET 基因表达样本分为高表达组和低表达组并绘制 Kaplan-Meier 生存曲线(图 2a),其结果显示,MET 基因高表达组患者的总生存率和生存时间低于(短于)低表达组患者,差异有统计学意义(P=4.6×10−5)。本研究进一步对 GEPIA 数据库中 178 例胰腺癌样本的 MET 基因表达与预后的关系进行分析,其结果也显示 MET 基因高表达组的总生存率和无病生存率均低于低表达组(图 2b、2c)。本研究使用 COX 回归模型进一步评估了 MET 的预后价值,单因素和多因素 COX 分析结果均显示:MET 基因高表达、患者年龄>65 岁和肿瘤 N1 分期是胰腺癌患者预后的独立危险因素(P<0.05),见表 2。


a:TCGA 数据库中 176 例胰腺癌患者的生存曲线;b、c:GEPIA 数据库中 178 例胰腺癌患者的总生存曲线(b)和无病生存曲线(c)
2.5 GO 富集分析结果
应用生物信息学对 TCGA 数据库的胰腺癌样本的基因表达进行分析,共获得 1 019 个 DEGs, 对其进行 GO 富集分析。其结果显示:MET 基因参与了:① 生物过程(biological process,BP),包括皮肤发育、组织迁移、Ras 蛋白信号传导、细胞趋化、酪氨酸肽基修饰、蛋白激酶 B 的信号、Rho 信号传导、G 蛋白偶联受体信号传导等;② 细胞成分(cellular component,CC),MET 可能参与构成了细胞质膜基底部;③ 分子功能(molecular function,MF),MET 可能参与调节跨膜受体蛋白酪氨酸激酶活性。具体见表 3。

2.6 KEGG 富集分析结果
应用生物信息学对胰腺癌 1 019 个差异表达基因进行 KEGG 通路分析,结果显示:MET 基因主要参与磷脂酰肌醇激酶/丝氨酸苏氨酸激酶(PI3K/AKT)信号通路、粘着斑(FAK) 信号通路、肿瘤蛋白聚糖、癌症转录失调节、轴突导向、肝细胞肝癌、黏着连接等。详见表 4。

3 讨论
胰腺癌是恶性程度最高的消化道肿瘤之一。因其起病隐匿、症状缺乏特异性,难以早期诊断,以致于多数患者就诊时已错过最佳治疗期[7]。因此,基于生物信息学筛选有效的肿瘤标志物对于胰腺癌临床早期筛查、早期诊断、及时治疗以及患者预后评价都具有重要意义。
原癌基因 MET 的蛋白产物 c-Met 是一种二硫键连接的 α-β 异二聚体受体酪氨酸激酶,主要在上皮细胞表达,其自然配体是由间充质细胞旁分泌的肝细胞生长因子(hepatocyte growth factor,HGF) [8]。正常生理情况下,c-Met 与外源性配体 HGF 结合发生自磷酸化具有多种生物调节功能,包括细胞有丝分裂、细胞迁移、组织再生、伤口愈合等,然而基因扩增或突变导致的 HGF/c-Met 信号轴病理性异常可激活多种下游信号通路促进肿瘤细胞增殖、侵袭转移和血管生成[9],如 PI3K/AKT 信号通路、两面神激酶/信号转导与转录激活子信号通路(JAK/STAT)、丝裂原激活的蛋白激酶途径(Ras/MAPK)以及 Wnt/β-连环素信号传导通路(Wnt /β-catenin)。Park 等[10]发现,约占 50% 的非小细胞肺癌患者都表现出 c-Met 过表达,并可预测其不良预后。MET 基因扩增导致的过表达还在胃食管癌、乳腺癌和神经胶质瘤都表现出与肿瘤患者不良预后相关[11]。此外,过表达的 HGF 还通过激活 MET 诱导粘着斑激酶(p125FAK)在 pY397(自磷酸化位点,结合 Src 家族 SH2 和 PI3-K 的 p85 亚基)和 pY861(Src 的主要磷酸化位点)的酪氨酸磷酸化,进而促进肿瘤细胞增殖、抗凋亡和侵袭迁移[12-13]。
本研究基于高通量基因组学筛选出胰腺癌的关键基因 MET。其分析结果显示,MET 基因在胰腺癌组织高表达并预示胰腺癌患者的不良预后。胰腺癌诊断模型 ROC 曲线显示,MET 在胰腺癌的诊断中具有较高的临床价值;而胰腺癌患者预后模型的 ROC 曲线敏感度和特异度均不高,可能归因于肿瘤样本量仍较少。通过对临床资料分析表明,MET 表达水平与患者年龄、肿瘤的组织学分级和 T 分期相关,提示 MET 可能促进肿瘤侵袭、加速肿瘤进展。进一步 COX 回归模型分析结果表明,MET 基因表达上调是胰腺癌患者预后不良的独立危险因素。MET 基因可能是胰腺癌有价值的肿瘤标志物。
为了进一步探究 MET 基因参与胰腺癌发生、发展的机制,本研究对胰腺癌 DEGs 进行 GO 富集分析,其结果显示,MET 基因参与了酪氨酸肽基修饰、蛋白激酶 B 信号、Ras 蛋白信号传导、Rho 信号传导、G 蛋白偶联受体信号传导等生物过程;KEGG 富集分析结果显示:MET 基因主要参与 PI3K-Akt 信号通路、FAK 信号通路、肿瘤蛋白聚糖、癌症转录失调节等信号通路。相关研究[14-15]表明,PI3K-Akt 信号通路和 FAK 信号通路是胰腺癌发生的关键途径。Asano 等[16]证实,胰腺癌 PI3K-Akt 信号通路的激活涉及受体酪氨酸激酶。大量的研究[9, 17-20]已证实,c-Met 激活的经典模式涉及 HGF 与 c-Met 的结合,进而诱导 c-Met 的胞质域进行自身磷酸化以触发下游信号通路,如 MAPK/ERK 途径、p38、PI3K/AKT 途径等。此外,c-Met 还可以其他非经典途径激活[21],如与 FAK 的串扰调节、基因突变等。HGF/c-Met 轴已被证实为肝细胞肝癌患者重要的预后生物标志物,并在肿瘤耐药性的发生中具有重要作用[22]。针对 c-Met 的靶向疗法有望成为胰腺癌有效的治疗方案,相关的临床试验已被应用与肝癌患者[23-24]。
我们基于生物信息学研究发现,MET 基因在胰腺癌的发生和进展中扮演了重要角色,其高表达预示了胰腺癌患者的不良预后,有望成为胰腺癌有价值的生物标志物和治疗靶点。有待进一步研究可能的分子机制为后续实验提供理论依据。
重要声明
利益冲突声明:作者宣称,本研究是在没有任何商业或金融关系的情况下进行的,没有潜在的利益冲突。
作者贡献声明:姚南和何进程提供了研究思路和方向;何进程和闵光涛实施研究并撰写初稿;王军和姜雷提供了论文修改意见。
胰腺癌是一种常见的恶性肿瘤,因其病程进展迅速及高侵袭性和高化学耐药的特点,胰腺癌的发病率和病死率在全球范围内均呈逐年递增趋势[1]。缺乏特异性肿瘤标志物作为早期筛查的手段和评价患者生存预后的指标,通常导致胰腺癌患者治疗延误[2]。因此,确立特异性生物标志物对于胰腺癌早期诊断和预后评价尤为重要。
胰腺癌的发生往往伴随多个基因的改变[3-4],而某些特殊基因异常表达可能是影响胰腺癌患者预后的重要因素,也有望成为个体化治疗的有效靶点[5]。近年来,随着测序技术的快速发展,高通量基因组学可有效挖掘在肿瘤发生发展中的关键基因,并进一步分析其与肿瘤发生发展的有关机制。本研究通过在基因表达综合(gene expression omnibus,GEO)数据库和癌症基因组图谱(the cancer genome atlas,TCGA)数据库下载胰腺癌基因芯片,筛选出与胰腺癌临床预后密切相关的关键基因即间充质上皮转化因子(mesenchymal epithelial transition factor,MET),并经基因表达谱交互分析(gene expression profiling interactive analysis,GEPIA)数据库进一步验证其在癌组织及其癌旁组织中的表达差异,探讨 MET 基因与胰腺癌发生有关的可能分子机制,以期作为胰腺癌预后评价的临床指标。
1 资料与方法
1.1 GEO 数据分析
在 GEO 数据库(
1.2 TCGA 数据分析
从 TCGA 数据库(
1.3 GO 和 KEGG 富集分析
使用 R 软件中的“clusterProfiler”“richplot”和“ggplot2”函数,对 DEGs 进行了基因本体论(gene ontology,GO)和京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)在线富集分析,其中仅有 P<0.05 且 FDR<0.05 的富集术语具有统计学差异。
1.4 GEPIA 数据库分析
通过 GEPIA 在线数据库(
1.5 统计学方法
采用 R(v.4.0.2)软件及 SPSS 26.0 软件对数据进行统计学分析。通过 Kolmogorov-Smirnov 检验 TCGA 数据库胰腺癌组织 MET 基因表达数据正态分布情况,结果显示符合正态分布,并使用 GraphPad Prism 7.0 软件绘制受试者工作特征(ROC)曲线。使用 R 软件 limma 包筛选 GSE28735 和 GSE62452 基因芯片数据集中胰腺癌组织与癌旁组织的 DEGs;采用 Wilcoxon 秩和检验分析胰腺癌临床病理特征与各基因表达量的关系,筛选临床相关性基因;采用 Pearson χ2 检验和连续校正法分析 MET 基因表达与胰腺癌患者临床病理特征的相关性;Kaplan-Meier 方法评估胰腺癌患者的总体生存情况;单因素 COX 回归分析 MET 基因表达及胰腺癌临床病理特征对患者预后的影响,并将 P<0.1 的变量纳入多因素 COX 回归分析。检验水准 α=0.05(双尾)。
2 结果
2.1 筛选胰腺癌关键基因
2.1.1 筛选胰腺癌癌组织及其癌旁组织中的 DEGs
以 |log2FC|>1 且 FDR<0.05(FC=肿瘤组织/癌旁组织)为筛选标准对 GSE28735 和 GSE62452 基因芯片进行基因差异表达分析,其结果显示:在 GSE28735 基因芯片中,有 240 个基因在胰腺癌组织中表达上调,171 个基因表达下调(图 1a);在 GSE62452 基因芯片中,有 180 个基因在胰腺癌组织中表达上调,114 个基因表达下调(图 1b)。

a:GSE28735 火山图;b:GSE62452 火山图;c:GSE28735 和 GSE62452 基因芯片的 DEGs 和 TCGA 临床相关基因整合后的韦恩图;d、e:示 GSE28735(d)和 GSE62452(e)基因芯片中 MET 基因在癌组织及其癌旁组织中的表达结果;f:GEPIA 数据库中胰腺癌组织及其癌旁组织中 MET 基因的表达;g、h:示 GSE28735(g)和 GSE62452(h)基因芯片中 MET 基因模拟诊断胰腺癌的 ROC 曲线;i:MET 基因模拟判断胰腺癌 5 年生存期的 ROC 曲线。火山图中 log2 FC 表示胰腺癌组织与癌旁组织中基因表达倍数的对数;–log(FDR)表示 FDR 法校正后的
2.1.2 筛选临床相关显著基因
对 TCGA 数据库中胰腺癌组织的基因芯片和胰腺癌临床病理特征(包括患者年龄、性别、肿瘤的组织学分级[6]、TNM 分期、T 分期以及 N 分期)进行相关性分析以筛选临床相关显著基因,结果共筛选到 103 个临床相关显著基因(P<0.05)。
2.1.3 筛选关键基因
使用 R 软件的“Venn Diagram”函数将差异表达显著基因与临床相关显著基因进行整合并可视化,其结果显示,在 GSE28735 和 GSE62452 基因芯片的差异表达基因中,有 281 个相同基因,提示这些基因可能与胰腺癌的发生发展具有密切关系;而差异表达显著基因且临床相关性较强的基因有 3 个(韦恩图,图 1c),分别为 MET、DEXD/H 盒解旋酶 60(DEXD/H box helicase 60,DDX60)和犬尿氨酸酶(kynureninase,KYNU)。本研究选择 MET 基因作为关键基因,进一步研究其表达对胰腺癌患者预后的影响。
2.2 MET 基因在胰腺癌组织及其癌旁组织中的表达情况
生物信息学分析结果显示:GSE28735 和 GSE62452 基因芯片中,MET 基因在胰腺癌组织中的表达量明显高于癌旁组织,其差异具有统计学意义(log2FC=1.28,P=2.0×10−9,FDR=1.64×10−9;log2FC=1.43,P=2.7×10−11,FDR=1.64×10−9),见图 1d、1e。在 GEPIA 在线数据库中,对 GEPIA 数据库中 179 例胰腺癌组织和 171 例癌旁组织样本的分析同样证实 MET 基因在胰腺癌组织中的表达量高于癌旁组织(P<0.001),见图 1f。为评估 MET 诊断胰腺癌的价值,本研究分别绘制了 GSE28735 和 GSE62452 基因芯片的 ROC 曲线,其结果显示, MET 基因模拟诊断胰腺癌的 ROC 曲线下面积(AUC)分别为 0.87 和 0.84,敏感度分别为 88.9% 和 73.9%,特异度分别为 82.2% 和 86.9%(图 1g、1h)。其结果提示 MET 可能是胰腺癌临床诊断有价值的生物标志物。
为了评估 MET 预测胰腺癌患者预后的价值,本研究以 5 年期的生存状态为结局变量,进一步绘制 ROC 曲线以分析 TCGA 数据库的 MET 基因表达数据,其结果显示,MET 基因模拟判断胰腺癌患者预后的 ROC 曲线下面积(AUC)为 0.72,最佳临界值(Cut-off)为 16.6,敏感度为 73.9%,特异度为 60.3%。见图 1i。
2.3 胰腺癌组织中 MET 基因表达与其临床病理特征的相关性分析结果
本研究将 TCGA 数据库 177 例胰腺癌组织样本筛选后得到 168 例临床信息完整的基因表达数据。通过与 MET 基因表达中位值比较将肿瘤样本分为高、低表达组,进一步 分析其 MET 基因的表达水平与胰腺癌临床病理特征的关系,结果显示 MET 基因的表达水平与患者年龄、T 分期和肿瘤的组织学分级(Grade)有关(P<0.05),与患者性别、TNM 分期和 N 分期无明显相关性(P>0.05),见表 1。

2.4 MET 基因表达对胰腺癌患者预后的影响
本研究将 TCGA 数据库预处理的 177 例胰腺癌样本整理后得到 176 例生存信息完整的 MET 基因表达数据,通过中位值将 MET 基因表达样本分为高表达组和低表达组并绘制 Kaplan-Meier 生存曲线(图 2a),其结果显示,MET 基因高表达组患者的总生存率和生存时间低于(短于)低表达组患者,差异有统计学意义(P=4.6×10−5)。本研究进一步对 GEPIA 数据库中 178 例胰腺癌样本的 MET 基因表达与预后的关系进行分析,其结果也显示 MET 基因高表达组的总生存率和无病生存率均低于低表达组(图 2b、2c)。本研究使用 COX 回归模型进一步评估了 MET 的预后价值,单因素和多因素 COX 分析结果均显示:MET 基因高表达、患者年龄>65 岁和肿瘤 N1 分期是胰腺癌患者预后的独立危险因素(P<0.05),见表 2。


a:TCGA 数据库中 176 例胰腺癌患者的生存曲线;b、c:GEPIA 数据库中 178 例胰腺癌患者的总生存曲线(b)和无病生存曲线(c)
2.5 GO 富集分析结果
应用生物信息学对 TCGA 数据库的胰腺癌样本的基因表达进行分析,共获得 1 019 个 DEGs, 对其进行 GO 富集分析。其结果显示:MET 基因参与了:① 生物过程(biological process,BP),包括皮肤发育、组织迁移、Ras 蛋白信号传导、细胞趋化、酪氨酸肽基修饰、蛋白激酶 B 的信号、Rho 信号传导、G 蛋白偶联受体信号传导等;② 细胞成分(cellular component,CC),MET 可能参与构成了细胞质膜基底部;③ 分子功能(molecular function,MF),MET 可能参与调节跨膜受体蛋白酪氨酸激酶活性。具体见表 3。

2.6 KEGG 富集分析结果
应用生物信息学对胰腺癌 1 019 个差异表达基因进行 KEGG 通路分析,结果显示:MET 基因主要参与磷脂酰肌醇激酶/丝氨酸苏氨酸激酶(PI3K/AKT)信号通路、粘着斑(FAK) 信号通路、肿瘤蛋白聚糖、癌症转录失调节、轴突导向、肝细胞肝癌、黏着连接等。详见表 4。

3 讨论
胰腺癌是恶性程度最高的消化道肿瘤之一。因其起病隐匿、症状缺乏特异性,难以早期诊断,以致于多数患者就诊时已错过最佳治疗期[7]。因此,基于生物信息学筛选有效的肿瘤标志物对于胰腺癌临床早期筛查、早期诊断、及时治疗以及患者预后评价都具有重要意义。
原癌基因 MET 的蛋白产物 c-Met 是一种二硫键连接的 α-β 异二聚体受体酪氨酸激酶,主要在上皮细胞表达,其自然配体是由间充质细胞旁分泌的肝细胞生长因子(hepatocyte growth factor,HGF) [8]。正常生理情况下,c-Met 与外源性配体 HGF 结合发生自磷酸化具有多种生物调节功能,包括细胞有丝分裂、细胞迁移、组织再生、伤口愈合等,然而基因扩增或突变导致的 HGF/c-Met 信号轴病理性异常可激活多种下游信号通路促进肿瘤细胞增殖、侵袭转移和血管生成[9],如 PI3K/AKT 信号通路、两面神激酶/信号转导与转录激活子信号通路(JAK/STAT)、丝裂原激活的蛋白激酶途径(Ras/MAPK)以及 Wnt/β-连环素信号传导通路(Wnt /β-catenin)。Park 等[10]发现,约占 50% 的非小细胞肺癌患者都表现出 c-Met 过表达,并可预测其不良预后。MET 基因扩增导致的过表达还在胃食管癌、乳腺癌和神经胶质瘤都表现出与肿瘤患者不良预后相关[11]。此外,过表达的 HGF 还通过激活 MET 诱导粘着斑激酶(p125FAK)在 pY397(自磷酸化位点,结合 Src 家族 SH2 和 PI3-K 的 p85 亚基)和 pY861(Src 的主要磷酸化位点)的酪氨酸磷酸化,进而促进肿瘤细胞增殖、抗凋亡和侵袭迁移[12-13]。
本研究基于高通量基因组学筛选出胰腺癌的关键基因 MET。其分析结果显示,MET 基因在胰腺癌组织高表达并预示胰腺癌患者的不良预后。胰腺癌诊断模型 ROC 曲线显示,MET 在胰腺癌的诊断中具有较高的临床价值;而胰腺癌患者预后模型的 ROC 曲线敏感度和特异度均不高,可能归因于肿瘤样本量仍较少。通过对临床资料分析表明,MET 表达水平与患者年龄、肿瘤的组织学分级和 T 分期相关,提示 MET 可能促进肿瘤侵袭、加速肿瘤进展。进一步 COX 回归模型分析结果表明,MET 基因表达上调是胰腺癌患者预后不良的独立危险因素。MET 基因可能是胰腺癌有价值的肿瘤标志物。
为了进一步探究 MET 基因参与胰腺癌发生、发展的机制,本研究对胰腺癌 DEGs 进行 GO 富集分析,其结果显示,MET 基因参与了酪氨酸肽基修饰、蛋白激酶 B 信号、Ras 蛋白信号传导、Rho 信号传导、G 蛋白偶联受体信号传导等生物过程;KEGG 富集分析结果显示:MET 基因主要参与 PI3K-Akt 信号通路、FAK 信号通路、肿瘤蛋白聚糖、癌症转录失调节等信号通路。相关研究[14-15]表明,PI3K-Akt 信号通路和 FAK 信号通路是胰腺癌发生的关键途径。Asano 等[16]证实,胰腺癌 PI3K-Akt 信号通路的激活涉及受体酪氨酸激酶。大量的研究[9, 17-20]已证实,c-Met 激活的经典模式涉及 HGF 与 c-Met 的结合,进而诱导 c-Met 的胞质域进行自身磷酸化以触发下游信号通路,如 MAPK/ERK 途径、p38、PI3K/AKT 途径等。此外,c-Met 还可以其他非经典途径激活[21],如与 FAK 的串扰调节、基因突变等。HGF/c-Met 轴已被证实为肝细胞肝癌患者重要的预后生物标志物,并在肿瘤耐药性的发生中具有重要作用[22]。针对 c-Met 的靶向疗法有望成为胰腺癌有效的治疗方案,相关的临床试验已被应用与肝癌患者[23-24]。
我们基于生物信息学研究发现,MET 基因在胰腺癌的发生和进展中扮演了重要角色,其高表达预示了胰腺癌患者的不良预后,有望成为胰腺癌有价值的生物标志物和治疗靶点。有待进一步研究可能的分子机制为后续实验提供理论依据。
重要声明
利益冲突声明:作者宣称,本研究是在没有任何商业或金融关系的情况下进行的,没有潜在的利益冲突。
作者贡献声明:姚南和何进程提供了研究思路和方向;何进程和闵光涛实施研究并撰写初稿;王军和姜雷提供了论文修改意见。