由平鑫而论专栏的各位老师深度挖掘我们精选的影像组学文章的出彩之处,并总结成优质推文,逐渐构建一幅影像组学文章套路舆图!
纵然技能照别人略逊一筹,我相信开图打也是能打赢的。预祝大家可以早日统辖全局,揭橥优质文章!
下半年一定要把握住,不做实验发医学SCI的新蓝海——影像组学!
先送你一份影像组学入门事宜手册,17+SCI,白嫖数据发6+的套路,单细胞+影像组学10+套路…点击理解详情免费领取!
下面进入正题
一
整体感知
1.题目要素拆解文章题目供应了三条信息:
1)预测变量:术前MRI影像组学signature
2)结局:早期复发(ER)
3)研究工具:肝门胆管癌(pCCA)
2.文章基本信息杂志
J Magn Reson Imaging
分区
2区
IF
5.12
揭橥韶光
2022.03
3.核心要素
研究工具(P):早期复发的肝门胆管癌(pCCA)患者(n = 184)
预后模型(I/C):(LASSO)logistic回归模型和逐步向后Logistic回归构建的影像组学signature
结局指标(O):早期复发ER(主);总生存期OS(次)
研究类型(S):回顾性行列步队研究,预后预测类型
研究目的:基于pCCA的临床和/或MRI的影像组学特色开拓新的signature,以预测ER
本文对ER的定义:从手术日期到首次局部区域复发、远处转移或末了一次随访日期的韶光。局部复发和远处转移通过妇科检讨和CT、MRI、PET-CT等影像诊断或病理证明(ref:PMID: 33376403)。
本文对OS的定义:手术日期与末了一次随访或去世亡日期之间的韶光间隔。中位生存韶光 (MST) 是 OS 的中位值。
4.变量剖析预测变量(X):影像组学signature;
结局变量(Y): 早期复发ER;总生存期OS;
协变量(Z):
人口学成分:性别、年事;
血液学指标:血糖水平、血小板计数、白细胞计数、中性粒细胞计数、淋巴细胞计数、单核细胞计数、白蛋白水平、球蛋白水平、白蛋白与球蛋白比例、中性粒细胞与淋巴细胞比例、单核细胞与淋巴细胞比例、血小板与淋巴细胞比例、TBIL(总胆红素)、DBIL(直接胆红素)、IBIL(间接胆红素)、ALT、AST、ALP、GGT、CEA、CA19-9;
病理指标:切除边缘、神经周围陵犯、病理分解、病理TNM分期;
影像征象:肿瘤最大径、临床N 分期、影像学肝动脉陵犯、环状显影、肝叶萎缩、HBV、动脉期增强、门静脉期增强、增殖模式;
小注:这里所有的影像征象识别分别由三名具有16、15、13年腹部诊断履历的放射科年夜夫完成,并事先对征象做好明确定义;
利用Cohen kappa系数对影像组学征象进行同等性评价,Kappa 值区间定义为 0.41–0.60(同等性适中)、0.61–0.80 (基本同等)0.81–1.00 (同等性极好);
(抛砖引玉,第一篇文章我这里把方法写详细一点)基线资料表中(未展示),卡方 (χ2) 考验或 Fisher 精确考验用于比较分类变量。Mann-Whitney U 考验或 t 考验用于比较连续变量。
5.研究背景临床问题:根治性手术切除是治疗能从手术获益pCCA的首选方案;然而该治疗方法的复发率依然很高,并且早期复发的pCCA患者有较差的预后;
因此,为了改进患者的预后,术前识别出术后 ER 风险高的患者必要性很大。
目前方法不敷:TNM分期是可以预测ER风险,然而同一分期的患者仍旧有较大的异质性;腹腔镜分期检测难以创造隐匿性转移性疾病;这些都会导致切除后早期复发。
本文办理办法:本文通过整合术前临床变量和基于 MRI 的影像组学特色,为 pCCA 患者开拓和验证决策支持的预测模型。
科学假设:预测模型可以在术前准确预测 pCCA 患者的术后 ER。
二
模型构建
1.workflow展示Figure 1
我们先来看一下流程图:
① VOI分割(动脉期;门静脉期)
② 特色提取(直方图特色、形态学特色、纹理特色)
③ 特色选择(ICC+LASSO-Logistic)
④ 领悟模型构建(影像组学模型+临床模型=领悟模型)
⑤ 模型评价(ROC+DCA+K-M)
2.纳入打消标准建立
第一部分:文章方法部分解读
纳入标准① 接管根治性切除手术;
② 经组织病理学证明为pCCA;
打消标准
① 缺少术前成像或图像上有运动和呼吸伪影;
② 在3T MRI 上检讨或不进行MRI 检讨;
③ 术前行经动脉化疗栓塞术;
④ 缺少后续临床数据;
⑤ 术后90天内去世亡;
⑥ 病理报告不完全或缺少术前血清检测;
第二部分:PICOS原则梳理
P:
年事:不限定,中位年事,61.0 岁;四分位距:53.0-66.8 岁;
性别:不限定,男性(n=115),女性(n=69);
疾病状态:首诊初治;
疾病分期:早期-晚期(I, II, IIIA, IIIB, IIIC, IVA, IVB期);
治疗方案:接管根治性切除手术;
诊断标准:病理诊断;
I/C:
影像设备:1.5T MRI ;
扫描序列:VIBE比拟增强序列;
期相:动脉期AP(20-35s),门静脉期PVP(60-70s);
靶区:沿肿瘤边缘勾画全瘤VOI;
影像检讨韶光点:术前4周内;
层厚:2mm;
比拟剂:0.1 mmoL/kg 造影剂以 2mL/s 的速率通过肘静脉注射;
O:
近期疗效:早期复发ER;
小注:本研究仅包括VIBE比拟增强序列的AP和PVP期相,不包括DWI、T1WI和T2WI。
作者在这里提及的缘故原由是pCCA肿瘤常日很小。不利于在非增强图像中对肿瘤进行勾画和区分肿瘤与正常组织的高下边界。
第三部分:纳排及分构成果
终极,共纳入184名患者,将数据集按7:3的比例分为演习集(n=128)和测试集(n=56)。并从中得到MRI影像数据、病理特色及临床特色数据。
3.图像分割(+图像预处理)
图像预处理随后对获取的DICOM影像进行图像预处理:
① Z值标准化:
方法:利用z-score()公式标准化所有MRI影像强度(Ref: PMID: 32704007);
工具:Caret包;
目的:将影像强度转化为以0为均数,1为标准差的分布,通过影像标准化等操作,减少影像参数不一致等对影像组学特色变异的影响;
② 重采样:
方法:将体素维度统一至1.01.01.0 mm3以标准化体素间距;
工具:Simple ITK包;
目的:最小化影像组学特色对体素大小的依赖性;
小注:本文采取MR影像,在图像预处理过程中并没有采取N4偏置场的校正(校正MRI影像的低强度不屈均性)
图像分割
分割过程由具有 16 年腹部诊断履历的放射科年夜夫实行,并选择随机30名患者由该年夜夫和一名具有 15年履历的放射科年夜夫进行重新分割。
利用 ITK-SNAP软件在每位患者的 AP 和 PVP 图像的轴向层上,沿肿瘤轮廓手动勾画出 VOI 。得到全瘤感兴趣体积VOI。
4.特色提取
工具:采取A.K.平台软件分别对AP以及PVP影像分割的VOI进行特色提取;
特色类型+提取结果:从每个 VOI 中提取了 402 个影像组学特色,包括 42 个直方图特色、15 个形状因子特色、144 个灰度共生矩阵(GLCM)特色、180 个游程长度矩阵(RLM)特色、11 个灰度大小区域矩阵(GLSZM) 特色和 10 个 Haralick 特色。
小注:A.K. (Artificial Intelligent Kit)平台由GE医疗生命科学中央推出的软件,能够提取一系列常见的影像组学特色。
包括直方图特色,形态学特色,共生矩阵特色,游程矩阵特色,灰度连通大小矩阵特色,基于梯度图的特色等。
5.特色选择
过滤法① 特色的同等性评价:
工具:irr包(文中方法部分写的icc包)
方法:利用ICC评估提取特色的可重复性,ICC>0.7的影像组学特色被保留到下一阶段进行剖析;
结果:保留来自AP期相中的325个特色和PVP期相中的254个特色;
② 异质性剖析及缺失落值处理:
工具:mice包,VIM包;
方法:剔除方差小于 1.0 的特色,然后用中位数更换缺失落值;
结果:保留来自AP期相中的167个特色和PVP期相中的117个特色;
③ 干系性剖析:
工具:caret包,findCorrelation函数;
方法:findCorrelation函数可以自动找到具有高度共线性的变量,并给出建议删除的变量
目的:去除冗余特色并降落特色的共线性;
Cut-off:干系性系数<0.7;
结果:保留来自AP期相20个特色 & PVP期相13个特色(PMID: 25028781);
小注:建议删除变量事理:假如有nn维度的干系矩阵,每个变量有n-1个干系系数(除了自己),对这n-1个干系系数取均匀值,这样每个变量都会得到一个均匀值,删去均匀值最高的变量。
嵌入法
④ 10折交叉验证+(LASSO)logistic回归:
工具:glmnet包
目的:交叉验证选择压缩参数λ,(LASSO)logistic回归筛选特色
Figure 2
Figure2 A:AP期相中,通过10-折交叉验证压缩参数λ,当压缩到12个特色时的AUC最大,对应log(λ) = -4.055x;
小注:左边的虚线对应AUC时最大值的点,代表最佳的λ值;+1倍标准差得到右边的虚线,代表具备优秀性能但特色数最少的模型,log(λ)在条线之间选取都是合理的。
Figure2 B:以最佳log(λ)值作为截断值,终极得到了12个影像组学特色;
Figure2 C:PVP期相中,通过10-折交叉验证压缩参数λ,当压缩到1个特色时的AUC最大,对应log(λ) = -3.093;
Figure2 D:以最佳log(λ)值作为截断值,终极得到了1个影像组学特色;
小注:与以往先容的文章不同,本文利用的是AUC参数来确定λ的值,在(LASSO)logistic回归的λ值的确定比较常见,是现在比较盛行的综合考量模型性能的一种参数。
结果:终极保留来自AP期相中的12个特色(log (λ) = -4.055)和PVP期相中的1个特色(log (λ) = -3.093);
包装法
⑤ 最小信息准则(AIC)的反向逐步逻辑回归:
选择构建逻辑回归模型的特色,并利用方程式推导出影像组学得分 (ScoreAP 或 ScorePVP);
AP期相有4个特色与ER干系,PVP期相无特色显示关联;
影像组学模型ScoreAP方程如下:
X1: MajorAxisLength;
X2: Inertia_- angle135_offset7;
X3: ShortRunHighGreyLevelEmphasis_- AllDirection_offset1_SD;
X4: ShortRunHigh GreyLevelEmphasis_AllDirection_offset4_SD;
小注:AIC(最小信息准则)建立在熵观点的根本上,可以权衡估计模型的繁芜度和模型拟合数据的优秀性。
为了只管即便避免数据涌现过度拟合的情形,优先考虑的模型该当是AIC值最小的那一个。基于此,找到最好的阐明结局但包含最少自由参数的模型。
至此,基于影像组学特色的预后模型构建完毕。
6.模型建立
临床模型通过独身只身分logistic回归(P < 0.1)和反向逐步多成分logistic回归剖析(最低AIC标准)依次选择预测的术前临床成分;(独身只身分、多成分剖析结果这里我没有展示)
小注:为了在独身只身分剖析中不遗漏故意义的变量,P值“显著”一样平常设为P<0.1,也可设为P<0.05或者P<0.2,需根据样本量大小做出调度,样本量够大可以把P值调小,样本量不敷则须要更守旧一点,把P值设大。
大略来说,这样做可以给多成分剖析更多说话的权力 (PMID: 32042812) 。
终极保留了9个临床成分用于预测,临床模型Scoreclinic方程式如下:
X1: blood glucose level;
X2: white blood cell count;
X3: globulin level;
X4: ratio of monocyte to lymphocyte;
X5: total bilirubin;
X6: γ-glutamide transpalase;
X7: CEA;
X8: CA19-9;
X9: invasion of hepatic artery in images.
随后画列线图:
至此,临床模型构建完毕。
领悟模型
随后,基于ScoreAP和Scoreclinic构建领悟线性模型:
随后画列线图:
至此,领悟模型构建完毕。
三
模型评价
1.性能度量
性能度量是衡量模型泛化能力的一系列评价标准,作者首先对临床模型(Model1)、影像组学模型(Model2)、领悟模型(Model3)、TNM评价系统(Model4)在演习集和测试集中预测ER的AUC值、准确度、特异度、灵敏度、阴性预测值和阳性预测值进行了打算,并绘制了四个模型的ROC曲线。
Table 3
Figure 3
结果显示:
比较临床模型在演习和测试集中的 AUC 分别为 0.841 (95% CI, 0.770–0.912) 和 0.821 (95% CI, 0.712–0.931)和其它两个模型的AUC,领悟模型在演习集 (AUC = 0.868, 95% CI, 0.807–0.928) 和测试集 (AUC = 0.835, 95% CI, 0.727–0.943) 中均具有较高的AUC值。显示出更好的预测性能和泛化能力。
同时我们可以看到,各模型间的95%置信区间是险些没有交叉的,更解释了模型泛化能力的本色差距。
小注:不同的AUC指标进行比较,纵然95%CI重合也是不能完备解释模型的预测能力是相同的,须要进一步进行Delong’s test比较P值
这里多说一句,基于表格中的敏感度和特异度,可以打算出约登指数(约登指数=敏感度+特异度-1)。
约登指数越大,解释真实性越大,约登指数最大值也就对应着该方法的最佳评分cut-off值,按最佳cut-off值可以将人群分为高风险组和低风险组。
基于演习集的最大约登指数得出ScoreAP = -0.806,得到的cut-off值将被同时运用于演习集和测试集(患者ScoreAP高于-0.806被分至高风险组,ScoreAP低于-0.806被分至低风险组)。
同理,临床模型的cut-off值为-0.256,领悟模型的cut-off值为-0. 472。这些cut-off值在随后的K-M曲线风险分层会用到,通过pROC包实现。
小注:此外,连续变量也可以基于K-M曲线的log-rank考验(survMisc包的cutpoint函数)和限定性立方样条(RCS)(rms包)打算cut-off值
随后,作者进一步利用Delong’s test进行显著性考验,比较各模型性能的差异:
Table 4
结果显示:
临床模型和领悟模型在演习集性能明显优于影像组学模型和TNM系统;在测试集中,临床模型和领悟模型性能都明显优于TNM系统,但是只有领悟模型明显优于影像组学模型。
临床模型和领悟模型的AUC 之间没有显著差异(演习集 P = 0.156,测试集 P = 0.439);影像组学模型和TNM系统的AUC也没有显著差异(演习集 P = 0.484,测试集 P = 0.418)。
随后作者对模型的校准度进行了评估(rms包):
Figure S3(文章补充资料中供应图片的清晰度都很差,但我为什么一点要展示呢?是叫大家要看补充材料!
)
结果显示:
朦胧中我们可以看出:
Figure S3A: 演习集中ER的预测值和不雅观察值表现出较好的同等性(都比较靠近对角线);
Figure S3B: 验证集中,绿色的线和粉色的线都是起飞的,只有Modelclinic与Modelcombine模型展现出了预测值与不雅观察值较好的同等性。
2.生存剖析风险分层
作者随后在补充材料展示了由模型分层的高风险和低风险组的Mean Score和 MST(survminer包),如前文提到,cutoff值由约登指数确定:
Figure S4 (文章补充资料中供应图片的清晰度都很差,但我为什么一点要展示呢?是叫大家要看补充材料!
)
Table S4
结果显示:
Figure S4ACE: 演习集中的影像组学模型(A)、临床模型(C)和领悟模型(E)高风险组的存活率与低风险组比较有显著差异;
Figure S4BDF: 测试集中的影像组学模型(B)、临床模型(D)和领悟模型(F)高风险组的存活率与低风险组比较有显著差异;
Figure S4FH: 而演习集中的TNM系统(G)(P=0.095)和测试集中的TNM系统(H)(P=0.068)中未不雅观察到高低分组之间的生存率差异。
3.临床意义
作者随后详细比较解读了评价四种模型在演习集和测试集中的DCA曲线(rmda包):
Figure 5
结果显示:
Figure 5A: 对付演习集,如果患者或年夜夫选择的高风险阈值在 10%–90% 的范围内,领悟模型(紫色曲线) 和临床模型(蓝色曲线)曲线位于NONE曲线和ALL曲线上方。
且利用领悟模型(紫色曲线) 或临床模型(蓝色曲线)在当前研究中预测 ER 的临床净获益明显高于影像组学模型(赤色曲线)、TNM 系统(粉色曲线)。
Figure 5B: 对付测试集,DCA 曲线显示,在 10%–78% 的高风险阈值范围内,领悟模型(紫色曲线) 和临床模型(蓝色曲线)曲线位于NONE曲线和ALL曲线上方。
且领悟模型(紫色曲线)和临床模型(蓝色曲线)预测ER的临床净获益明显高于影像组学模型(赤色曲线)、TNM 系统(粉色曲线)。
在演习和测试集中,临床模型和领悟模型具有相似的净收益,影像组学模型与 TNM 系统具有相似的净收益。
四
全文总结
本文开拓基于影像组学特色和临床特色的非侵入模型,术前预测pCCA患者术后早期复发。
与最广泛采取的 pCCA AJCC 分期系统比较,构建的临床模型和领悟模型具有更优的预测能力。
文章套路性十足,能在2022年轻松上2区我认为有以下上风:
① 多期相提取特色:利用了动脉期相和门静脉期相提取影像组学特色,虽然终极没有门静脉期的影像组学特色被纳入构建模型,但这样的考试测验更符合临床事情认知;
② 文章纳入的临床变量非常多,且包括影像学征象,数据较为完全;
③ 对影像的判断,结局,随访都有很明确的定义;
④ 文章整体框架完全,写作逻辑很强,3年发了将近40篇影像组学文章,作者也是影像组学方面的老鸟;
⑤ 在特色选择部分,利用了最小信息准则AIC结合反向逐步逻辑回归,对模型构建时的拟合情形进行了比较全面的考虑,该方法具有可移植性。
此外同样是LASSO回归,作者的因变量(纵坐标)用的AUC,这个方法确定LASSO(logistic)回归的λ值比二项式偏差更为热门;
⑥ 在模型评价部分对各模型进行的多个角度的比较,且证明模型预测效果好于现有临床标准的预测效果,这也是可以学习的;
⑦ 与同样具备完全套路的文章比较,文章的数据展示做的比较好,每一步得到什么都有迹可循,并对所用到的cutoff值都进行了明确的定义;
同时我还创造,本文2021年7月揭橥电子版,基本是同一个行列步队和类似的临床问题,作者在2021年三月发了另一篇文章。短短4个月,两篇2区文章 (在2020年12月还有一篇)。
uu们是不是眼馋了呢?奉劝大家赶紧捉住这波红利,早日实现0到1的打破,发出自己的第一篇影像组学文章!
不过呢,文章还是有一些在能力范围内可以加强的点:
① 首先是图像预处理时可以进行N4偏置场的校正;
② 虽然说对付预测模型来说,如果终极预测效果比较好的模型纳入的变量如果有共线性是不用肃清的。但是本文纳入的血液指标还是太多了,存在的殽杂成分很难厘清;
② 在模型间的比较时,如果能加入最近比较盛行的净重新分类指数(NRI)和整体鉴别指数(IDI)进行进一步比较,会更加丰富;
④ 末了,我还是要吐槽一句,文章的补充材料Figure的清晰度实在是TCL,图片全部打码,我给作者发了邮件也在researchgate上问了补充材料信息,还没得到回答。
原来精读一篇文献可以提取到这么多有用的信息!
好啦,本期的文献分享到这里,我们随后将会有一大波影像组学精读推文拆解来袭,篇篇都是精华,是不是很期待呢?连续跟紧君莲数据库的平鑫而论专栏,我们下期见吧~~
参考文献
[1] Zhao J, Zhang W, Zhu YY, et al. Development and Validation of Noninvasive MRI-Based Signature for Preoperative Prediction of Early Recurrence in Perihilar Cholangiocarcinoma. J Magn Reson Imaging. 2022;55(3):787-802. doi:10.1002/jmri.27846
[2] Zhao J, Zhang W, Fan CL, et al. Development and validation of preoperative magnetic resonance imaging-based survival predictive nomograms for patients with perihilar cholangiocarcinoma after radical resection: A pilot study. Eur J Radiol. 2021;138:109631. doi:10.1016/j.ejrad.2021.109631
[3] Zhao J, Zhang W, Zhang J, et al. Independent Risk Factors of Early Recurrence After Curative Resection for Perihilar Cholangiocarcinoma: Adjuvant Chemotherapy May Be Beneficial in Early Recurrence Subgroup. Cancer Manag Res. 2020;12:13111-13123. Published 2020 Dec 22. doi:10.2147/CMAR.S289094
[4] Zhou ZR, Wang WW, Li Y, et al. In-depth mining of clinical data: the construction of clinical prediction model with R. Ann Transl Med. 2019;7(23):796. doi:10.21037/atm.2019.08.63
[5] Carré A, Klausner G, Edjlali M, et al. Standardization of brain MR images across machines and protocols: bridging the gap for MRI-based radiomics. Sci Rep. 2020;10(1):12340. Published 2020 Jul 23. doi:10.1038/s41598-020-69298-z
[6] Mazurowski MA, Zhang J, Grimm LJ, Yoon SC, Silber JI. Radiogenomic analysis of breast cancer: luminal B molecular subtype is associated with enhancement dynamics at MR imaging. Radiology. 2014;273(2):365-372. doi:10.1148/radiol.14132641