01
文献信息
本次分享的文献是由安徽医科大学第一附属医院联合美国宾夕法尼亚大学佩雷尔曼医学院、浙江大学第二医院、安徽阜南医院等多中心合作团队于2025年9月29日在《Biomarker Research》(IF=11.5,Q1)上发表的研究“Machine learning-based radiomics model: prognostic prediction and mechanism exploration in patients with endometrial cancer”即基于机器学习的影像组学模型:子宫内膜癌患者的预后预测及机制探索,该研究通过回顾性+前瞻性收集602例多中心子宫内膜癌(EC)患者数据,提取肿瘤及瘤周5mm区域的T2WI影像组学特征,采用10种机器学习方法构建预后模型,评估其对术后总生存期(OS)的预测价值;进一步结合临床指标、病理组学、转录组学及蛋白质组学分析增量价值,并通过公共数据库(TCGA、CPTAC)和细胞/组织实验,验证模型与肿瘤血管生成及FLT1基因的关联,最终建立“影像-分子-临床”整合的预后评估体系。
图2:研究设计概述
阶段1:ROI勾画与特征提取:肿瘤+瘤周ROI,提取原始/平方根/对数等变换特征(共1200+特征);
阶段2:模型构建与评估:10种机器学习方法,用ROC、DCA、校准曲线等评估;
阶段3:机制探索与验证:从差异基因到细胞/组织实验验证。
02
研究背景及目标
研究背景
疾病负担:子宫内膜癌是女性生殖系统最常见恶性肿瘤之一,全球发病率逐年上升;手术为主的综合治疗后,早期患者5年生存率70%-90%,但中晚期/复发患者骤降至30%,预后差异显著。
传统预后局限:现有预后评估依赖FIGO分期、分化程度等临床病理指标,准确率仅60%-70%,无法完全反映肿瘤异质性与生物学行为。
技术机遇:影像组学(Radiomics)可从MRI中提取高维特征,非侵入性反映肿瘤病理生理信息;结合机器学习可优化预后模型;多参数MRI(IVIM-DWI、DCE-MRI)可评估肿瘤血管生成,为机制探索提供影像依据。
研究目标
明确肿瘤及瘤周影像组学特征的机器学习模型对子宫内膜癌患者术后OS的预测效能;
分析该模型对现有临床、病理组学、转录组学、蛋白质组学模型的增量价值;
探索影像组学模型的生物学机制,挖掘关键分子标志物(如FLT1),为靶向治疗提供方向。
03
数据和方法
研究数据
患者来源:3个中心+TCGA/CPTAC公共数据库
总样本量:602例EC患者
训练集:271例(回顾性)
验证集:154例(回顾性)
测试集1:90例(前瞻性)
测试集2:43例(TCGA+CPTAC)
影像数据:T2WI(提取肿瘤+瘤周5mmROI)、IVIM-DWI(ADC、D、D*、f值)、DCE-MRI(Ktrans、Kep、Ve、Vp值);
多组学数据:CPTAC-UCEC的35例病理组学(H&E染色特征)、转录组学(RNA表达)、蛋白质组学(蛋白表达)数据;
图1:患者招募流程
技术方法
影像处理与特征提取
ROI勾画:2名放射科医生用3DSlicer手动勾画T2WI上肿瘤及瘤周5mm区域,融合为3DVOI;
特征筛选:用PyRadiomics提取纹理特征,通过ICC>0.75(评估特征稳健性)、Spearman相关<0.90(排除冗余)、LASSO回归(特征选择),最终保留16个肿瘤特征+12个瘤周特征;
模型构建与评估
机器学习方法:比较10种模型(aorsf、bart、Deepsurv、deephit、dnnsurv、GBM、glmnet、RSF、SVM、XGboost),筛选最优Radscore(影像组学评分);
联合模型构建:结合临床指标(FIGO分期、分化程度等)构建列线图,用NRI、IDI评估增量价值;结合多组学数据构建整合模型;
模型评估指标:时间依赖ROC(AUC)、校准曲线(拟合度)、决策曲线(DCA,临床净获益)、临床影响曲线(风险分层)、Log-rank检验。
机制探索与实验验证
分子机制:按Radscore分层CPTAC患者,筛选转录组-蛋白质组交集差异基因,GO/KEGG富集分析,Cytoscape找枢纽基因;
实验验证:siRNA敲低FLT1,通过细胞共培养、血管生成实验、CCK8(增殖)、Transwell(侵袭)、划痕实验(迁移)验证功能;组织免疫荧光检测FLT1与CD31(血管标志物)表达。
统计分析
统计方法:ICC(特征稳健性)、LASSO(特征选择)、多因素Cox回归(预后因素)、DeLong检验(模型效能对比)。
04
实验结果图
图3:机器学习模型比较
XGBoost模型在验证集和测试集中表现最优(复合AUC最高),且肿瘤与瘤周特征联合模型预测效能高于单独使用肿瘤特征。
图4:放射组学对临床指标的增量价值
联合模型(Radscore+FIGO分期+分化程度)在训练集、验证集和测试集中均显示高预测精度(AUC0.872–0.992)。NRI和IDI分析表明Radscore显著提升模型区分能力。
图5:多组学模型联合价值
放射组学与病理组学、转录组学、蛋白组学联合模型显示极高效能(1–5年AUC0.989–1.000),校准曲线和决策曲线证实模型拟合良好且具临床实用性。
图6:放射组学模型的生物学机制
转录组与蛋白组交集基因(307个)富集于血管生成和缺氧响应通路。FLT1是核心基因之一,与Radscore显著相关(r=0.85,p=0.001),单细胞分析显示FLT1主要在内皮细胞和肿瘤细胞中表达。
图7:生物学机制验证
IVIM-DWI参数(f值)和DCE-MRI参数(Ktrans、Kep)与Radscore及FLT1表达显著相关,证实放射组学特征可反映肿瘤血管生成水平。免疫荧光显示高Radscore患者FLT1和CD31(血管标志物)表达更高。细胞实验表明敲低FLT1抑制EC细胞迁移、侵袭和血管生成。
05
讨论
临床价值
该模型可精准预测子宫内膜癌术后总生存期,补充临床指标不足,与病理组学、转录组学等协同提升预测效能,还揭示其与肿瘤血管生成及FLT1相关,助力患者风险分层,为个体化治疗及抗血管治疗提供依据。
技术亮点
基于多中心数据,提取肿瘤及瘤周5mm影像特征,用10种机器学习筛选出最优XGboost模型,结合功能MRI验证,还通过多组学与实验明确FLT1相关机制,提升模型可靠性与可解释性。