📊
🧬
🔍
⚗️
💡
🎯
🚀

iAorta 研究笔记

Posted by CYXYZ on March 11, 2026

AI-based diagnosis of acute aortic syndrome from noncontrast CT

论文PDF

简介

从完成的任务和实现的手段来说,这并不是一个基座模型.基座模型需要满足:大规模,多任务,自监督(非必须),可迁移,通用表征,并且能够显著提升多个下游任务(如分割,配准,诊断)等的性能。

报告了一个基于人工只能的疾病识别系统:利用 非对比CT 进行 AAS疾病(主动脉综合症) 早期诊断,并为临床医生提供可解释性的警告。主要是在只利用非造影CT的基础上,可以在不同医院,不同设备,不同人群中较为快速的识别 AAS疾病。

研究目标

  • 核心问题
    • AAS 诊断和治疗的延误显著恶化了 预后,凸现了快速准确识别 AAS 的重要性。
    • CTAAAS 具有高度敏感性,但价格昂贵,并具有并发症的风险。并且很多时候没必要做 CTA,一般只做 无对比剂CT
    • 但是仅通过 无对比剂CT 诊断 AAS 名没有在先前的研究中得到很好的描述和评估。

针对上述问题,提出 iAorta,能够在中国实现紧急情况下,快速准确的通过无对比剂 CT 扫描 识别 AAS。

  • 基本方法和假设
    • 收集带有 无对比剂CT 和 增强CT(CTA) 的配对主动脉检查数据,并且CTA检查结果通常是准确的。

iAorta 解决的问题:

  1. 模型在不同的医院,设备,人群上表现稳定。
  2. 模型的可解释性输出是否能提升医生的诊断准确率。
  3. 模型是否能适应不同的 无对比剂 CT 扫描协议。
  4. 模型的流程能否部署到临床。

研究数据和结果

这里只关注研究数据量和使用的标准。

在中国的九个医院 按照四个阶段逐步研究。

核心实验

  • 第一阶段,在 2287 个内部数据和 18463 个外部数据中评估了模型。
  • 第二阶段,和专业医生使用相同数据对比结果;医生 + 模型辅助看时间和准确率 评估效果。
  • 第三阶段,在三个医院的 145201 份数据 和 137525 名患者上 测试了模型。
  • 第四阶段,把模型进行部署,在13846名连续患者的 14436 份无对比剂CT上比较 医生使用模型和不使用模型的结果。同时部署后,模型自动在 15584 名患者上测试 16054 份 无对比CT 的结果。 和第二阶段的区别就是一个没有部署,一个部署了。

评估指标

真阳性 (TP)、真阴性 (TN)、假阳性 (FP) 和 假阴性 (FN)

  1. AUC (Area Under the Curve): 通过改变模型的预测概率阈值(其实就是改变 AAS患者和非AAS患者 的数量比),绘制 ROC 曲线(纵轴为敏感性,横轴为 1-特异性),计算该曲线下方的面积 。 含义:衡量模型在任何阈值下的整体分类能力,不随样本分布改变而波动 。

  2. 敏感性 (Sensitivity) 也叫召回率:识别 AAS 阳性患者的能力(研究特别强调了对 TAAD、TBAD、IMH、PAU 四种亚型的分类敏感性) 。 公式:\(\text{Sensitivity} = \frac{TP}{TP + FN}\) 含义:在所有真正的 AAS 患者中,模型正确检出的比例 。

  3. 特异性 (Specificity) 意义:指在所有并未患有 AAS 的人群中,被模型正确判定为“阴性”的比例。 公式:\(\text{Specificity} = \frac{TN}{TN + FP}\) 含义:在所有非 AAS 的人群中,模型正确判断为“正常”的比例 。

  4. 准确率 (Accuracy) 公式:\(\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}\) 含义:模型对所有样本(包含有病和无病)做出正确判断的比例 。

  5. 阳性预测值 (PPV / Precision) 公式:\(\text{PPV} = \frac{TP}{TP + FP}\) 含义:在模型预警为“阳性”的所有案例中,真正确诊为 AAS 的比例 。

  6. 阴性预测值 (NPV) 公式:\(\text{NPV} = \frac{TN}{TN + FN}\) 含义:在模型判定为“阴性”的所有案例中,确实没有患病的比例 。

  7. F1 分数 (F1-score)
    公式:\(F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}\) 含义:由于 AAS 是极低概率事件(数据极不平衡),F1 分数是精确率和召回率的调和平均,用于综合评价模型的稳定性 。 精确率公式为: \(\text{Precision (PPV)} = \frac{TP}{TP + FP}\)

  8. 95% 置信区间 (95% CI) 计算方式:研究采用了 Clopper-Pearson 方法(针对比例指标)或 1,000 次自助抽样法 (Bootstrapping) 。含义:反映指标的可信程度。区间越窄,说明实验结果越稳定、越具有代表性 。

  9. Cohen’s $\kappa$ 系数 和数学中计算是否相关的 kappa系数 一样 公式:\(\kappa = \frac{P_o - P_e}{1 - P_e}\)($P_o$ 为观察到的符合率,$P_e$ 为偶然符合率)。含义:用于评估模型预测结果与医生诊断金标准之间的一致性,排除了由于“靠运气猜对”的可能性 。

  10. 从入院到正确诊断的时间 (Time to correct diagnostic pathway) 公式:\(\text{确诊时间} = T_{\text{AI/医生识别}} - T_{\text{入院}}\) 具体节点:从患者到达急诊科开始计时,直到非增强 CT 报告中首次提到 AAS 阳性可能并建议进行 CTA 检查的时间点为止 。

研究方法

训练

  • 从浙江大学医学院第一附属医院 收集 3350 例患者的 CTA 扫描:包含成对的增强型和非对比剂 CT,对于增强型CTA,使用了 病变的“金标准”标注主动脉壁,真腔,假腔和病变类型。
  • 通过配准技术,将增强型动脉病变标注转移到非对比剂CT萨和嗯,实现精确监督。
    • 第一阶段:使用轻量级 nnU-Net 从原始的CT图像中粗略分割出全动脉;
    • 第二阶段:采用多任务学习策略,同时进行患者的 AAS分类和像素级的主动脉腔壁和真腔分割;
    • 可解释性的输出:生成激活图以突出显示潜在比病变区域。、

问题:文章并没有说图像配准是如何实现的。

补充知识

随访数据(follow‑up data)是医学研究和临床实践里非常核心的一类数据,它指的是: 患者在初次诊断或治疗之后,持续一段时间内的真实临床结局记录。