AI-based diagnosis of acute aortic syndrome from noncontrast CT

论文PDF

简介

从完成的任务和实现的手段来说，这并不是一个基座模型.基座模型需要满足：大规模，多任务，自监督(非必须)，可迁移，通用表征，并且能够显著提升多个下游任务(如分割，配准，诊断)等的性能。

报告了一个基于人工只能的疾病识别系统：利用 非对比CT 进行 AAS疾病(主动脉综合症) 早期诊断，并为临床医生提供可解释性的警告。主要是在只利用非造影CT的基础上，可以在不同医院，不同设备，不同人群中较为快速的识别 AAS疾病。

研究目标

核心问题
- AAS 诊断和治疗的延误显著恶化了预后，凸现了快速准确识别 AAS 的重要性。
- CTA 对 AAS 具有高度敏感性，但价格昂贵，并具有并发症的风险。并且很多时候没必要做 CTA，一般只做 无对比剂CT。
- 但是仅通过 无对比剂CT 诊断 AAS 名没有在先前的研究中得到很好的描述和评估。

针对上述问题，提出 iAorta，能够在中国实现紧急情况下，快速准确的通过无对比剂 CT 扫描识别 AAS。

基本方法和假设
- 收集带有无对比剂CT 和增强CT(CTA) 的配对主动脉检查数据，并且CTA检查结果通常是准确的。

iAorta 解决的问题：

模型在不同的医院，设备，人群上表现稳定。
模型的可解释性输出是否能提升医生的诊断准确率。
模型是否能适应不同的无对比剂 CT 扫描协议。
模型的流程能否部署到临床。

研究数据和结果

这里只关注研究数据量和使用的标准。

在中国的九个医院按照四个阶段逐步研究。

核心实验

第一阶段，在 2287 个内部数据和 18463 个外部数据中评估了模型。
第二阶段，和专业医生使用相同数据对比结果；医生 + 模型辅助看时间和准确率评估效果。
第三阶段，在三个医院的 145201 份数据和 137525 名患者上测试了模型。
第四阶段，把模型进行部署，在13846名连续患者的 14436 份无对比剂CT上比较医生使用模型和不使用模型的结果。同时部署后，模型自动在 15584 名患者上测试 16054 份无对比CT 的结果。和第二阶段的区别就是一个没有部署，一个部署了。

评估指标

真阳性 (TP)、真阴性 (TN)、假阳性 (FP) 和假阴性 (FN)

AUC (Area Under the Curve)：通过改变模型的预测概率阈值（其实就是改变 AAS患者和非AAS患者的数量比），绘制 ROC 曲线（纵轴为敏感性，横轴为 1-特异性），计算该曲线下方的面积。含义：衡量模型在任何阈值下的整体分类能力，不随样本分布改变而波动。
敏感性 (Sensitivity) 也叫召回率：识别 AAS 阳性患者的能力（研究特别强调了对 TAAD、TBAD、IMH、PAU 四种亚型的分类敏感性）。公式：$\text{Sensitivity} = \frac{TP}{TP + FN}$ 含义：在所有真正的 AAS 患者中，模型正确检出的比例。
特异性 (Specificity) 意义：指在所有并未患有 AAS 的人群中，被模型正确判定为“阴性”的比例。公式：$\text{Specificity} = \frac{TN}{TN + FP}$ 含义：在所有非 AAS 的人群中，模型正确判断为“正常”的比例。
准确率 (Accuracy) 公式：$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}$ 含义：模型对所有样本（包含有病和无病）做出正确判断的比例。
阳性预测值 (PPV / Precision) 公式：$\text{PPV} = \frac{TP}{TP + FP}$ 含义：在模型预警为“阳性”的所有案例中，真正确诊为 AAS 的比例。
阴性预测值 (NPV) 公式：$\text{NPV} = \frac{TN}{TN + FN}$ 含义：在模型判定为“阴性”的所有案例中，确实没有患病的比例。
F1 分数 (F1-score)
公式：$F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$ 含义：由于 AAS 是极低概率事件（数据极不平衡），F1 分数是精确率和召回率的调和平均，用于综合评价模型的稳定性。精确率公式为： $\text{Precision (PPV)} = \frac{TP}{TP + FP}$
95% 置信区间 (95% CI) 计算方式：研究采用了 Clopper-Pearson 方法（针对比例指标）或 1,000 次自助抽样法 (Bootstrapping) 。含义：反映指标的可信程度。区间越窄，说明实验结果越稳定、越具有代表性。
Cohen’s $\kappa$ 系数和数学中计算是否相关的 kappa系数一样公式：$\kappa = \frac{P_o - P_e}{1 - P_e}$（$P_o$ 为观察到的符合率，$P_e$ 为偶然符合率）。含义：用于评估模型预测结果与医生诊断金标准之间的一致性，排除了由于“靠运气猜对”的可能性。
从入院到正确诊断的时间 (Time to correct diagnostic pathway) 公式：$\text{确诊时间} = T_{\text{AI/医生识别}} - T_{\text{入院}}$ 具体节点：从患者到达急诊科开始计时，直到非增强 CT 报告中首次提到 AAS 阳性可能并建议进行 CTA 检查的时间点为止。

研究方法

训练

从浙江大学医学院第一附属医院收集 3350 例患者的 CTA 扫描：包含成对的增强型和非对比剂 CT，对于增强型CTA，使用了病变的“金标准”标注主动脉壁，真腔，假腔和病变类型。
通过配准技术，将增强型动脉病变标注转移到非对比剂CT萨和嗯，实现精确监督。
- 第一阶段：使用轻量级 nnU-Net 从原始的CT图像中粗略分割出全动脉；
- 第二阶段：采用多任务学习策略，同时进行患者的 AAS分类和像素级的主动脉腔壁和真腔分割；
- 可解释性的输出：生成激活图以突出显示潜在比病变区域。、

问题：文章并没有说图像配准是如何实现的。

补充知识

随访数据（follow‑up data）是医学研究和临床实践里非常核心的一类数据，它指的是：患者在初次诊断或治疗之后，持续一段时间内的真实临床结局记录。

iAorta 研究笔记