2. 复旦大学附属金山医院放射科 上海 201508;
3. 上海交通大学医学院附属上海市胸科医院放射科 上海 200030
2. Department of Radiology, Jinshan Hospital, Fudan University, Shanghai 201508, China;
3. Department of Radiology, Shanghai Chest Hospital, Shanghai Jiao Tong University, Shanghai 200032, China
肺癌是最常见的恶性肿瘤,其发病率和死亡率均高居恶性肿瘤首位,严重威胁着人类的健康和生命[1-2]。肺癌的早期诊断和治疗是降低死亡率的关键。近年来,随着低剂量CT的广泛应用以及健康体检的普及,肺结节的检出率显著提高,给肺结节的管理带来巨大挑战。大多数持续存在的肺磨玻璃结节(ground-glass nodule,GGN)虽为肺腺癌或癌前病变,但大部分呈惰性生长,且非浸润性腺癌手术切除后的5年生存率近100%[3],因此仍需长期随访,这增加了GGN的管理难度。
靶CT扫描(targeted CT,T-CT)通过结合小扫描野和大矩阵,有效提高组织的空间分辨率,较常规CT扫描(conventional CT,C-CT)更利于显示GGN的影像学细节[4],已广泛应用于临床日常诊断中。影像组学能从影像学图像中深度挖掘信息,并寻找肉眼无法识别的疾病的细微结构特征,能够反映人体组织、细胞和基因水平的变化,从而对疾病的诊治提供帮助[5]。研究发现,基于GGN患者T-CT图像的诊断较C-CT图像更利于减少不必要的随访[6]。然而,基于T-CT和C-CT图像的影像组学模型预测GGN 2年生长的差异尚不清楚。
倍增时间常用于评估肺结节的生长速度,与体积倍增时间(volume doubling time,VDT)相比,质量倍增时间(mass doubling time,MDT)能同时反映结节大小和密度变化,因而能更敏感、更可靠地评估结节的生长速度[7]。Tan等[8]基于VDT区分肺结节的快速、慢速增长,并结合临床特征建立了影像组学模型以预测肺结节的生长速度。Yoon等[9]选取结节边缘相关的影像组学特征建立了GGN生长预测模型,但未考虑密度变化也是GGN生长的一种形式。Qiu等[10]根据GGN直径增加和实性成分出现定义纯GGN生长,但未考虑GGN密度增加但尚未出现实性成分的情况。因此,本研究基于GGN的直径、密度增加定义生长,通过比较基于T-CT和C-CT图像建立的影像组学特征集预测GGN 2年生长的效能,确定适当的建模扫描方案,进一步建立影像组学列线图来帮助管理GGN。
资料和方法病例资料 本研究经上海市胸科医院伦理委员会批准(批准文号:KS1956),免除患者知情同意。回顾性搜集上海市胸科医院PACS系统中2018年10月—2019年1月肺GGN随访患者的CT图像及临床资料。纳入标准:(1)GGN的最长径为4~30 mm;(2)同时有基线的T-CT图像和C-CT图像;(3)生长结节在2年内生长,未生长结节至少随访2年。排除标准:(1)图像有明显伪影;(2)随访期间行抗肿瘤治疗;(3)T-CT图像未扫及随访的GGN。收集患者的基线年龄、性别,对其CT图像进行分析,收集结节的毛刺征、胸膜凹陷征、肺气肿等特征。最终389例患者共414个肺GGN纳入本研究。
结节分组和生长定义 将每个结节的基线T-CT图像和C-CT图像分为T-CT组和C-CT组。将纳入的414个GGN按照7∶3的比例随机分为训练组(n=290)和验证组(n=124)。根据GGN在2年内是否生长分为生长组和稳定组。“生长”定义为结节长径至少增加2 mm和/或平均CT值至少增加30%[11-12]。“稳定”定义为结节大小和平均CT值均保持稳定。
扫描方法 使用多层螺旋CT(Ingenuity 128,iCT 256,美国Philips公司)进行扫描。患者仰卧位,头先进,在吸气后屏住呼吸进行胸部C-CT高分辨率扫描,扫描范围从肺尖至肺底。扫描参数:管电压120 kV,管电流250 mA,准直0.625 mm,螺距0.984,扫描时间5~7 s,视野(field of view,FOV)为400 mm×400 mm,图像矩阵为512×512,采用标准重建算法序列进行薄层重建,重建层厚和间隔均为1 mm,滤过函数C。发现病灶后,立即对病灶区域行T-CT超高分辨率扫描,扫描参数:管电压为120 kV,管电流250 mA,准直0.625 mm,螺距0.641,扫描时间5~7 s,FOV为180 mm×180 mm,图像矩阵为1 024×1 024,重建层厚和间隔均为1 mm,滤过函数C。观察的肺窗窗宽为1 450 HU,窗位为-520 HU;纵隔窗窗宽为300 HU,窗位为35 HU。
结节分割 将患者的CT图像导入ITK-SNAP(3.8.0版),调至肺窗后,基于横断位图像沿每层结节边缘手动勾画感兴趣区,生成体积感兴趣区(VOI)。首先由第一位医师对所有结节进行勾画。1个月后,随机抽取30个结节的图像,由第一位医师和第二位医师进行重复勾画,以评估影像组学特征的组内和组间可重复性。结节的生长特征和临床信息均对2位医师行盲法处理。
影像组学特征提取和筛选 使用Pyradiomics软件(https://pypi.org/project/pyradiomics/)对勾画所得的肺结节T-CT VOI和C-CT VOI进行影像组学特征的提取和筛选,并采用图像生物标志物标准化倡议(IBSI)推荐的标准(https://arxiv.org/abs/1612.07003)对所有图像进行归一化处理,分别从每个GGN的T-CT VOI和C-CT VOI图像中提取一阶、二阶、高阶、小波变换及高斯变换特征。将组内和组间相关系数<0.75的特征去除后,进一步去除Pearson相关系数>0.9的冗余特征(若两个特征相关性较高,则去除具有最大平均绝对值相关性的特征),对保留下来的特征行进一步筛选:使用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)经10倍交叉验证的方法得到最小误差λ,并根据λ得到系数非零的影像组学特征。对最优影像组学特征进行线性拟合,根据各自加权系数,生成影像组学评分(radscore),以计算每个GGN对应的radscore。
影像组学特征集构建和交叉预测 根据训练组的最优影像组学特征,分别构建T-CT和C-CT影像组学特征集(radiomics signature)模型以预测GGN的2年生长。使用验证组数据分别对以上两个模型进行验证和交叉预测(用T-CT模型预测C-CT数据;用C-CT模型预测T-CT数据),计算各自的AUC、敏感度和特异度。采用Delong检验比较T-CT和C-CT影像组学特征集的预测效能,选取二者中表现较佳的模型进一步建立影像组学列线图。
影像组学列线图构建 选取患者的临床资料(年龄、性别)以及影像科医师评估的影像学特征(胸膜凹陷征、毛刺征、肺气肿)作为临床特征;采用多因素二元逻辑回归分析在上述临床特征中筛选出GGN 2年生长的独立危险因子,并构建临床特征集(clinical signature);采用多因素逻辑回归的方法结合影像组学特征集和临床特征集,构建成影像组学列线图(radiomics nomogram)。使用验证组的数据对建立的训练组模型进行验证,分别计算AUC、敏感度和特异度以评估模型效能。采用Hosmer-Lemeshow试验绘制校准曲线来评估影像组学列线图在训练组和验证组中的拟合度和预测性能。
临床应用价值 为评估影像组学的临床实用性,采用临床决策曲线比较不同概率阈值下分别基于3个模型(影像组学特征集、临床特征集与影像组学列线图)决策时GGN患者能获得的临床净收益。
统计学分析 使用SPSS(26.0版)和R软件(3.0.1版)。采用独立样本t检验比较生长组和稳定组,训练组和验证组之间连续变量的差异性。采用χ2检验比较各组间分类变量的差异。P<0.05为差异有统计学意义。采用“glmnet”软件包进行LASSO回归分析、线性回归分析以及Logistic回归分析,以筛选影像组学特征及临床特征。采用“rms”软件包进行列线图、刻度曲线绘制,采用“pROC”软件包计算AUC,采用“dca.R”软件进行决策曲线分析。
结果临床资料 本研究最终纳入389例患者共414个肺GGN,基线最长径为6~26 mm,其中72个结节最终经手术切除。2年内生长的GGN(生长组)为88个,保持稳定的GGN(稳定组)为326个。生长组中,65个GGN仅大小改变,8个GGN仅密度增高,15个GGN同时发生大小和密度改变。研究的流程图见图 1。生长组和稳定组,训练组和验证组的临床特征见表 1。所有临床特征在训练组和验证组之间差异均无统计学意义。年龄、性别、胸膜凹陷征、毛刺征在生长组和稳定组之间差异有统计学意义(P<0.05)。
[n(%) or x±s] | |||||||||||||||||||||||||||||
Characteristics | Group | t or χ2 | P | Group | t or χ2 | P | |||||||||||||||||||||||
Growing(n=88) | Stable(n=326) | Training(n=290) | Validation(n=124) | ||||||||||||||||||||||||||
Age(y) | 61.9±10.7 | 53.0±11.7 | -6.788a | <0.001 | 54.5±12.2 | 56.0±11.7 | -1.180a | 0.239 | |||||||||||||||||||||
Gender | 7.448b | 0.006 | 0.646b | 0.421 | |||||||||||||||||||||||||
Male | 37(29.60) | 88(70.40) | 91(72.80) | 34(27.20) | |||||||||||||||||||||||||
Female | 51(17.65) | 238(82.35) | 199(68.86) | 90(31.14) | |||||||||||||||||||||||||
Pleural retraction | 11(12.50) | 16(4.91) | 6.552b | 0.010 | 20(6.90) | 7(5.65) | 0.223b | 0.637 | |||||||||||||||||||||
Spiculation | 7(7.95) | 0(0) | 21.809b | <0.001 | 6(2.07) | 1(0.81) | 0.247b | 0.620 | |||||||||||||||||||||
Emphysema | 7(7.95) | 9(2.76) | 3.730b | 0.053 | 11(3.79) | 5(4.03) | 0.000b | 1.000 | |||||||||||||||||||||
a t value;b χ2 value.GGN:Ground-glass nodule. |
特征提取、筛选和影像组学特征集构建 GGN的基线T-CT VOI和C-CT VOI(图 2)各提取1 317个影像组学特征,经特征筛选后,分别筛选出7个和6个最优影像组学特征(图 3),由此构建成T-CT和C-CT影像组学特征集以预测GGN的2年生长,并分别计算两组的radscore值,radscore公式见附加文件。
影像组学特征集效能、交叉预测效能 T-CT和C-CT影像组学特征集在训练组和验证组中的预测效能、T-CT影像组学特征集预测C-CT数据的效能、C-CT影像组学特征集预测T-CT数据的效能如表 2所示。Delong检验比较各模型的预测结果如表 3所示。T-CT和C-CT影像组学特征集预测GGN 2年生长的AUC无显著性差异。考虑到C-CT在临床中应用更广泛,本研究最终选取C-CT影像组学特征集,并结合临床特征进一步构建影像组学列线图。采用C-CT影像组学特征集对T-CT图像进行2年生长预测时,与采用C-CT影像组学特征集对C-CT图像进行验证的AUC差异无统计学意义,与采用T-CT影像组学特征集对T-CT图像进行验证的AUC差异无统计学意义。
Models | AUC | 95%CI | SPE(%) | SEN(%) |
T-CT radiomics signature | ||||
Training group | 0.942 | 0.907-0.976 | 84.35 | 95.00 |
Validation group | 0.865 | 0.779-0.951 | 95.83 | 64.29 |
Predictiona group | 0.881 | 0.803-0.959 | 91.67 | 75.00 |
C-CT radiomics signature | ||||
Training group | 0.943 | 0.912-0.974 | 89.13 | 90.00 |
Validation group | 0.899 | 0.833-0.965 | 90.63 | 75.00 |
Predictionb group | 0.881 | 0.801-0.960 | 90.63 | 75.00 |
Clincial signature | ||||
Training group | 0.762 | 0.692-0.833 | 63.91 | 76.67 |
Validation group | 0.754 | 0.642-0.867 | 77.08 | 67.86 |
C-CT radiomics nomogram | ||||
Training group | 0.948 | 0.919-0.977 | 87.39 | 90.00 |
Validation group | 0.933 | 0.874-0.993 | 80.21 | 96.43 |
AUC:Area under the curve;CI:Confidence interval;SPE:Specificity;SEN:Sensitivity;T-CT:Targeted CT;C-CT:Conventional CT.a Prediction group used data based on the C-CT images(n=124),b Prediction group used data based on the T-CT images(n=124). |
Models | Z | P |
C-CT radiomics signature vs. C-CT cross modela | ||
Validation group | 1.443 | 0.151 |
T-CT radiomics signature vs. C-CT cross modela | ||
Validation group | 1.386 | 0.168 |
T-CT radiomics signature vs. C-CT radiomics signature | ||
Training group | -0.143 | 0.887 |
Validation group | -1.610 | 0.107 |
Radiomics signature vs. radiomics nomogram | ||
Training group | -1.378 | 0.168 |
Validation group | -1.407 | 0.160 |
Clinical signature vs. radiomics nomogram | ||
Training group | 5.131 | <0.001 |
Validation group | 2.265 | 0.024 |
a C-CT cross model used C-CT radiomics signature to predict the two-year growth of GGN based on T-CT images. |
临床特征集、影像组学列线图预测效能 多因素Logistic回归分析显示:年龄、性别和毛刺征是GGN 2年生长的独立危险因素。结合影像组学特征集与独立危险因素,构建影像组学列线图以预测GGN 2年生长(图 4、5)。校正曲线显示其预测结果和实际结果一致(附加文件)。临床特征集、影像组学列线图在训练组和验证组中预测GGN 2年生长的效能见表 2。无论是在训练组还是验证组中,影像组学列线图均具有最高的AUC。但影像组学列线图与C-CT影像组学特征集的AUC无显著性差异(表 3),独立危险因素的结合未能显著提高模型的预测效能。
临床实用性 临床决策曲线显示,在一定概率阈值下,相较于“全干预”或“零干预”的处理方法,影像组学特征集和影像组学列线图均能有效预测GGN 2年生长,提高患者临床净收益。在大多数概率阈值下,相较于影像组学特征集,基于影像组学列线图的决策能使患者获得更高的临床净收益(图 6)。
讨论近年来,低剂量CT肺癌筛查的普遍应用显著提高了肺GGN的检出率,同时肺GGN的管理面临更大挑战。为优化肺GGN的管理,本研究构建了基于小视野超高分辨率的T-CT和常规高分辨率N-CT扫描图像构建的影像组学特征集,并比较了两者预测GGN 2年生长的效能,有助于选取合理的随访手段,同时结合年龄、性别和毛刺征3个临床特征进一步构建了影像组学列线图,实现了对GGN无创性个体化2年生长预测,减少了不必要的随访,具有临床应用价值。
Fleischner学会2017版指南建议:6 mm以上的GGN随访至少5年以监测其变化。但研究发现部分<6 mm的GGN虽在5年随访期间保持稳定,但5年后仍会生长[13]。因此,无论何种大小的GGN,>5年的长期随访皆有必要。尽管指南根据结节的直径、类型及危险因素推荐了不同随访间隔(3~6个月、6~12个月或18~24个月),在一定程度上减少了不必要的随访,但>5年(甚至10年)的长期随访导致患者过度辐射暴露、经济负担增加。因此,长期管理GGN中如何合理减少CT扫描随访至关重要。
本研究中,T-CT和C-CT影像组学特征集分别由7个和6个最优影像组学特征构建,两组中只有3个特征相同。而国外学者发现CT像素大小不同时,近80%的影像组学特征在患者内的变异性大于在患者间的变异性[14]。因此,我们认为CT像素大小不同导致的患者内影像组学特征差异可能是本研究两组模型部分特征不同的主要原因。虽然T-CT和C-CT的最优影像组学特征不完全相同,但预测GGN 2年生长的效能相仿,且C-CT模型预测T-CT和T-CT模型预测C-CT的效能也相仿。因此,我们认为随访GGN可不必额外行T-CT,采用C-CT图像即足以预测GGN的生长;即使患者仅提供T-CT图像,也能采用C-CT影像组学特征集预测GGN的2年生长。这不仅减少了额外T-CT带来的辐射暴露,同时缩短了患者的检查时间,减少了图像存储负荷,提高了检查效率。考虑到部分与GGN生长相关的影像学特征难以勾画进VOI(如毛刺征等),因此也被纳入临床特征中。从临床特征中,我们筛选出年龄、性别和毛刺征3个特征为GGN 2年生长的独立危险因素,这与部分学者的研究结果类似[13, 15]。肺癌发病率随年龄段增加而增加[16],表皮生长因子受体突变多见于男性,与GGN的生长速度呈正相关[17-18],这可能是男性较女性GGN更易生长的原因。毛刺征由肿瘤的浸润部分对周围组织牵拉形成,能够反映肿瘤的浸润程度,而恶性程度高的GGN生长速度较恶性程度较低者快,因此毛刺征可能与GGN生长相关。
最近一项研究结果与本研究结果有所不同,Tao等[19]比较了基于不同像素的图像建立的影像组学特征集预测GGN的浸润性,发现3组模型中几乎无共同的影像组学特征,而像素最小(即扫描矩阵大)的模型具有最高的诊断效能(P<0.05)。本研究的目的是利于基线GGN图像预测其2年中是否生长,不同的研究目的可能导致不一致的结果。其次,文献报道的研究对象是经病理证实的GGN,尽管其中部分为病理证实的良性病变,但包含的恶性征象可能较多,而良性征象较多的病变可能未行手术切除。而我们的研究对象是随访的GGN,仅部分经手术切除,恶性征象相对较少,这可能是导致结果不同的主要原因。此外,我们的研究样本量更大,同时结合临床特征,提高了模型的临床净收益。
本研究存在以下不足:(1)本研究基于回顾性单中心、单一厂商和CT设备,可能会影响模型的稳健性和普适性。未来需要收集多中心、多设备的样本来验证模型。(2)本研究评估结节生长是基于结节最长径和密度的变化,相比之下,基于体积或质量来监测结节生长更为敏感[7, 20]。
综上所述,我们采用临床应用更广泛的C-CT影像组学特征集结合临床特征进一步建立影像组学列线图以预测GGN的2年生长,虽然模型效能无显著提高,但患者临床净收益得到提高,因此具有临床应用价值。通过列线图计算GGN 2年生长预测值,有助于合理减少随访,将有效帮助管理GGN:低预测值的GGN患者可延长随访间隔;高预测值的GGN患者则应尽早穿刺或手术切除,以减少不必要的随访。
作者贡献声明 薛丽敏 科研设计,数据采集和分析,图表绘制,论文撰写和修订。李瀛 科研设计,数据分析,图表绘制,可行性分析,论文修订。强金伟 研究设想,可行性分析,监督指导,论文修订。于红 可行性分析。张玉,邓林,陶广昱 数据采集和整理。
利益冲突声明 所有作者均声明不存在利益冲突。
[1] |
FERLAY J, SOERJOMATARAM I, DIKSHIT R, et al. Cancer incidence and mortality worldwide: sources, methods and major patterns in GLOBOCAN 2012[J]. In J Cancer, 2015, 136(5): E359-E386.
[URI]
|
[2] |
郑荣寿, 孙可欣, 张思维, 等. 2015年中国恶性肿瘤流行情况分析[J]. 中华肿瘤杂志, 2019, 41(1): 19-28. [DOI]
|
[3] |
TRAVIS WD, BRAMBILLA E, NOGUCHI M, et al. International association for the study of lung cancer/American Thoracic Society/European Respiratory Society: international multidisciplinary classification of lung adenocarcinoma: executive summary[J]. Proc Am Thorac Soc, 2011, 8(5): 381-385.
[DOI]
|
[4] |
MIYATA T, YANAGAWA M, HATA A, et al. Influence of field of view size on image quality: ultra-high-resolution CT vs. conventional high-resolution CT[J]. Eur Radiol, 2020, 30(6): 3324-3333.
[DOI]
|
[5] |
LAMBIN P, LEIJENAAR RTH, DEIST TM, et al. Radiomics: the bridge between medical imaging and personalized medicine[J]. Nat Rev Clin Oncol, 2017, 14(12): 749-762.
[DOI]
|
[6] |
ZHU H, ZHANG L, WANG Y, et al. Improved image quality and diagnostic potential using ultra-high-resolution computed tomography of the lung with small scan FOV: a prospective study[J]. PLoS One, 2017, 12(2): e0172688.
[DOI]
|
[7] |
DE HOOP B, GIETEMA H, DE VORST SVAN, et al. Pulmonary ground-glass nodules: increase in mass as an early indicator of growth[J]. Radiology, 2010, 255(1): 199-206.
[DOI]
|
[8] |
TAN M, MA W, SUN Y, et al. Prediction of the growth rate of early-stage lung adenocarcinoma by radiomics[J]. Front Oncol, 2021, 11: 658138.
[DOI]
|
[9] |
YOON HJ, PARK H, LEE HY, et al. Prediction of tumor doubling time of lung adenocarcinoma using radiomic margin characteristics[J]. Thorac Cancer, 2020, 11(9): 2600-2609.
[DOI]
|
[10] |
QIU T, RU X, YIN K, et al. Two nomograms based on CT features to predict tumor invasiveness of pulmonary adenocarcinoma and growth in pure GGN: a retrospective analysis[J]. Jpn J Radiol, 2020, 38(8): 761-770.
[DOI]
|
[11] |
NAIR A, BALDWIN DR, FIELD JK, et al. Measurement methods and algorithms for the management of solid nodules[J]. J Thorac Imaging, 2012, 27(4): 230-239.
[DOI]
|
[12] |
SCHOLTEN ET, DE JONG PA, DE HOOP B, et al. Towards a close computed tomography monitoring approach for screen detected subsolid pulmonary nodules?[J]. Eur Resp J, 2015, 45(3): 765-773.
[DOI]
|
[13] |
LEE HW, JIN KN, LEE JK, et al. Long-term follow-up of ground-glass nodules after 5 years of stability[J]. J Thorac Oncol, 2019, 14(8): 1370-1377.
[DOI]
|
[14] |
MACKIN D, FAVE X, ZHANG L, et al. Harmonizing the pixel size in retrospective computed tomography radiomics studies[J]. PLoS One, 2017, 12(9): e0178524.
[DOI]
|
[15] |
HIRAMATSUM, INAGAKI T, INAGAKI T, et al. Pulmonary ground-glass opacity (GGO) lesions-large size and a history of lung cancer are risk factors for growth[J]. J Thorac Oncol, 2008, 3(11): 1245-1250.
[DOI]
|
[16] |
赫捷, 李霓, 陈万青, 等. 中国肺癌筛查与早诊早治指南(2021, 北京)[J]. 中华肿瘤, 2021, 30(2): 81-111. [CNKI]
|
[17] |
KOBAYASHI Y, MITSUDOMI T, SAKAO Y, et al. Genetic features of pulmonary adenocarcinoma presenting with ground-glass nodules: the differences between nodules with and without growth[J]. Ann Oncol, 2015, 26(1): 156-161.
[DOI]
|
[18] |
SUGANO M, SHIMIZU K, NAKANO T, et al. Correlation between computed tomography findings and epidermal growth factor receptor and KARS gene mutations in patients with pulmonary adenocarcinoma[J]. Oncol Rep, 2011, 26(5): 1205-1211.
[URI]
|
[19] |
TAO G, YIN L, SHI D, et al. Dependence of radiomic features on pixel size affects the diagnostic performance of radiomic signature for the invasiveness of pulmonary ground-glass nodule[J]. Br J Radiol, 2021, 94(1118): 20200089.
[DOI]
|
[20] |
YANKELEVITZ DF, REEVES AP, KOSTIS WJ, et al. Small pulmonary nodules: volumetrically determined growth rates based on CT evaluation[J]. Radiology, 2000, 217(1): 251-256.
[DOI]
|