2026-05-19 医学图像分割论文精读:Semi-MedRef 与 Anatomical Shape Priors

503611908 发布于 3 小时前 6 次阅读


今日医学图像分割最新论文精读追踪

今日结论

今天没有检索到明确已接收 MICCAI/CVPR/ICCV/ECCV/NeurIPS/ICLR/MedIA/TMI 等顶会/顶刊的全新医学图像分割论文;去重后,最值得关注的是两篇 2026-05-15 arXiv 新稿:Semi-MedRefEvaluation of Anatomical Shape Priors。前者代表“医学 referring segmentation + 半监督 + 图文对齐”的新方向,后者是一篇有价值的负结果研究,提醒我们在强 3D U-Net 基线上简单加入手工形状先验未必有效。

检索说明

今日检索范围覆盖 arXiv 最新提交、医学图像分割/medical image segmentation、polyp segmentation、3D medical image segmentation、U-Net/nnU-Net、Mamba、SAM/foundation model、referring medical segmentation 等关键词,并重点查看 2026-05-15 以后新增候选;未发现当天可确认的顶会/顶刊正式接收版本,因此从最新且 PDF 可获取的 arXiv preprint 中筛选。所有入选论文均为 2025 年及以后。已检查历史推荐记录并排除了重复论文;本次跳过的重复候选包括 Med-DisSeg、SpectraFlow、SplitFed-CL、DuetFair、CMFDNet、Topo-VM-UNetV2 等。

WordPress 发布

  • WordPress 文章链接:发布后见本文元信息
  • WordPress Post ID:发布后见本文元信息

论文 1:Semi-MedRef: Semi-Supervised Medical Referring Image Segmentation with Cross-Modal Alignment

基本信息

  • 标题:Semi-MedRef: Semi-Supervised Medical Referring Image Segmentation with Cross-Modal Alignment
  • 作者 / 第一作者:Yuchen Li, Zhen Zhao, Yi Liu, Luping Zhou / Yuchen Li
  • 时间:2026-05-15 arXiv v1
  • 来源:arXiv preprint,arXiv:2605.15720
  • 论文页面链接:https://arxiv.org/abs/2605.15720
  • PDF 文件 / PDF 链接:/tmp/medseg_daily_2026-05-19/semi_medref_2605.15720.pdf;https://arxiv.org/pdf/2605.15720
  • 代码链接:未获取;arXiv 页面和 PDF 正文中未确认官方 GitHub
  • 任务:Medical Referring Image Segmentation(MRIS),即用医学图像 + 文本位置/病灶描述共同指定分割目标;半监督低标注设置
  • 数据集:QaTa-COV19、MosMedData+
  • 方法类型:teacher-student semi-supervised segmentation;cross-modal augmentation;image-text contrastive learning;U-Net/ConvNeXt + CXR-BERT 多模态分割框架

paper-deep-reader 精读结果

1. 一句话结论

Semi-MedRef 的核心价值不在提出一个全新 U-Net backbone,而在于把半监督医学文本引导分割中最容易出错的“强增强破坏图文空间对齐”问题拆成可操作的 T-PatchMix、PosAug 和 ITCL 三个机制,适合关注少标注、文本提示和医学 foundation/referring segmentation 的研究者精读。

2. 研究背景与核心问题

论文研究的是 semi-supervised medical referring image segmentation:输入不是单纯图像,而是图像 I 与文本描述 T,模型输出二值 mask Y。这种任务在胸片/CT 感染区域、带位置描述的病灶分割中很有意义,因为纯视觉分割有时不知道“要分哪一个区域”,而文本可给出 upper/lower、left/right、lesion site 等定位线索。

作者把问题设为少量有标注图文-mask 三元组 Dl 与大量无 mask 的图文对 Du。模型 fθ(I,T) 经过 sigmoid 得到像素概率图 P ∈ [0,1]^{H×W}。难点是:半监督学习依赖 teacher-student、伪标签和强增强;但 referring segmentation 中图像增强与文本增强若不同步,会破坏“文本指代区域”和“图像中实际区域”的对应关系,尤其医学文本常依赖 laterality 与解剖位置,例如 left/right、upper/middle/lower。

3. 现有方法不足

作者指出现有方法主要有三类不足:

  1. 自然图像 RES 半监督方法(如 RESMatch/SemiRES)可做 weak-to-strong consistency,但通常只处理简单 flip 下 left/right 替换,对医学位置语言不足。
  2. 医学文本提示分割方法(如 LViT、Textmatch、GuideDecoder、MMI-UNet)强调视觉-文本融合,但在强增强、低标注、无标签伪监督下如何保持 cross-modal alignment 仍不充分。
  3. CutMix/PatchMix 在单模态 SSL 中有效,但直接用于图文医学分割时可能把图像 patch 换掉却不更新文本,导致“文本说左下肺,图像 patch 来自右上区域”的伪监督污染。

因此,论文真正要解决的不是 segmentation decoder 本身,而是 半监督 MRIS 中强扰动与图文空间语义一致性的冲突

4. 方法总览

Semi-MedRef 是一个两阶段 teacher-student 框架:

  • Burn-in 阶段:只用有标注数据训练 student,监督损失为 Dice + BCE,即 Lsup = LDiceCE(σ(fθS(I,T)), Y)
  • Semi-supervised 阶段:teacher 用 EMA 更新,θT ← m θT + (1-m)θS,其中 m=0.999。teacher 在弱增强视图上生成概率图并阈值化得到硬伪 mask;student 在强增强图文视图上学习匹配伪 mask。
  • 总体损失L = Lsup + λu Lunsup + λsup_itcl Lsup_itcl + λunsup_itcl Lunsup_itcl

框架中的三个关键部件是:

  1. PosAug:对文本中的位置短语做 dropout 或 fuzzing,避免模型过拟合精确位置词。
  2. T-PatchMix:把 PatchMix/CutMix 改造成图文同步增强,只在位置兼容或 teacher 高置信病灶区域混合 patch,并同步更新文本位置 span。
  3. ITCL:基于 coarse position pseudo-label 构造 soft positives 的图文对比学习,不再像 CLIP 那样把 batch 中所有其他文本都当硬负样本。

5. 核心模块拆解

模块 A:PosAug(Position-aware Text Augmentation)
输入是 student 分支文本中的位置短语,例如 “upper left lung”。输出是被扰动后的文本:一种是用 [UNK_POS] 替换位置短语,另一种是把具体位置 fuzz 成 “a region of the lung” 这类弱位置表述。其作用是让模型在文本位置不完整或不精确时仍依赖图像证据。它的创新性中等,但对医学 referring segmentation 很实用;迁移到 polyp segmentation 时价值取决于是否有文本指代,如果只是标准全自动息肉分割则用处有限。

模块 B:T-PatchMix(Image-Text Alignment-preserving Patch Mixing)
输入为两个无标签图文对 (Ii,Ti)(Ij,Tj) 和 block-wise mask Mi。图像混合为 Imix=(1-Mi)⊙Ii + Mi⊙Ij。作者提供两种采样规则:位置约束混合会把文本位置映射到 left/right × upper/middle/lower 的粗区域,只在兼容区域混合;概率驱动混合从 teacher 高置信概率图中选 patch,并用 lesion-gating ratio ri = sum(Pj^T⊙Mi)/(sum Mi + ε) 过滤非病灶 patch。伪标签也同步混合 teacher probability,并在混合有效时替换或合并文本位置 span。

这个模块是真正的机制核心:它把单模态 CutMix 转换成“图像 patch、伪 mask、位置文本”三者同步的增强。对 3D medical segmentation 可迁移为 anatomy-aware crop/mix,但需要 3D 位置词或器官 atlas;对 DAMamba/U-Net 主干改造本身不是 backbone 模块,而更像训练策略。

模块 C:ITCL(Position-guided Image-Text Contrastive Learning)
模型从融合特征图 F 得到图像 embedding v=ProjI(GAP(F)),从文本得到 embedding u=ProjT(T),相似度为 Sij=v_i^T u_j/τ。关键是作者用位置 pseudo-label q_i∈{0,1}^6 表示 left/right × upper/middle/lower,以 Jaccard affinity Aij=|qi∩qj|/|qi∪qj| 构造 soft positive 权重,再做双向 weighted contrastive loss。这样,同一 batch 中描述相近解剖位置的样本不会被简单当成硬负样本。

这个设计比直接套 CLIP loss 更合理;消融中 CLIP 版本 Dice 低于 ITCL 版本,支持作者的机制判断。

6. 实验设计与结果

实验使用两个 MRIS 数据集:

  • QaTa-COV19:5716 train、1429 validation、2113 test;
  • MosMedData+:2183 train、273 validation、273 test。

半监督比例设置为 1%、2%、5%、15% 有标注,其余训练样本作为无标注;主要指标是 Dice 和 mIoU。实现使用 PyTorch Lightning 与 MONAI,图像 resized 到 224×224,batch size 32,AdamW 初始学习率 3e-4,单张 NVIDIA RTX A6000。默认 backbone 是 MMI-UNet,视觉编码器 ConvNeXt,文本编码器 CXR-BERT。

主要结果:

  • QaTa-COV19 上,Ours(MMI-UNet) 在 2%/5%/15%/100% label ratio 下 Dice 分别为 87.25、88.31、89.84、91.39,高于 MMI-UNet baseline 的 84.63、87.35、88.72、90.88。
  • MosMedData+ 上,Ours(MMI-UNet) 在 5%/15%/100% 下 Dice 为 74.51、76.42、78.70,高于 MMI-UNet 的 72.26、74.00、78.42;2% 情况下 Ours(GuideDecoder) 的 Dice 72.87 高于 GuideDecoder 66.34,Ours(MMI-UNet) 71.16 高于 MMI-UNet 68.23。
  • 消融显示,在 QaTa-COV19 1%/2% 下,从 baseline 到 teacher-student EMA、PosAug、T-PatchMix、ITCL 逐步提高;1% Dice 从 81.02 提升到 86.39,2% Dice 从 84.63 提升到 87.25。
  • 增强消融显示 naive CutMix 使 Dice 降到 83.09,低于 baseline 84.58;T-PatchMix 版本为 85.59;加入 ITCL 的 Ours-All 达 86.39,说明“对齐保持”不是装饰,而是必要条件。

7. 实验可信度判断

证据整体较强,但边界清晰:

  • 可信点:有两个医学 MRIS 数据集;多个 label ratio;对比自然图像 RES、医学文本引导分割和半监督方法;有组件级消融,并特别验证 naive CutMix 会损害性能,直接支撑论文主张。
  • 弱点:任务集中在 COVID 胸部影像与位置文本,尚不能证明对多器官 CT、MRI、内镜息肉或 3D 体数据普适;Textmatch 部分结果引用原论文且非所有 label ratio 都有;未看到统计显著性检验;代码未确认公开;输入 resize 到 224×224,不能代表高分辨率 3D 医学分割工程。
  • 结论强度:可以相信其“在 MRIS 低标注场景下,alignment-aware augmentation 优于 naive multimodal augmentation”的主张;但不应扩大为“通用医学图像分割新 SOTA backbone”。

8. 与主流医学图像分割框架的关系

  • U-Net/nnU-Net:Semi-MedRef 不是替代 U-Net 的结构,而是可叠加在 U-Net-like 多模态分割器上的训练/增强框架。其默认模型 MMI-UNet 仍保留 U-Net 式分割思想。
  • MedNeXt / CNN-based segmentation:可把 ConvNeXt/MedNeXt 类 encoder 当视觉分支,但本文贡献不是卷积模块。
  • TransUNet / Swin-UNet / LViT:更接近 LViT 的 language-guided segmentation 方向;如果用 Transformer 融合图文,PosAug/T-PatchMix/ITCL 仍可作为训练策略。
  • Mamba / VMamba / SegMamba / DAMamba:没有使用 SSM/Mamba;但如果 DAMamba 做文本提示或半监督医学 referring segmentation,T-PatchMix 与 ITCL 可作为训练层面的补充。
  • foundation medical segmentation / SAM/MedSAM:不像 MedSAM 那样做 promptable universal segmentation;它更关注文本位置描述与医学图像之间的弱监督对齐。可与 SAM-generated pseudo label 或 MedSAM encoder 结合,但论文未验证。

9. 对我课题的价值

如果你的核心课题是 polyp segmentation 或 DAMamba backbone,Semi-MedRef 不是直接 baseline 替代;但它有三点可借鉴:

  1. 训练策略借鉴:把 CutMix/Copy-Paste 改造成 anatomy-aware 或 lesion-aware 版本,避免破坏伪标签语义。
  2. 弱标注/文本提示方向:如果未来做报告文本、位置提示、医生描述引导的分割,这篇可以作为 related work 中 MRIS + SSL 的新近参考。
  3. 消融设计借鉴:它明确比较 naive CutMix、generic TextStrong、CLIP loss 和 ITCL,对证明“医学特定对齐机制必要”很有帮助。

对纯全自动息肉分割,建议只吸收 lesion-gated mixing 与 alignment-aware augmentation 的思想,不必照搬文本分支。

10. 阅读建议

建议精读。如果你正在写医学图像分割 foundation/referring/weakly supervised 相关论文,值得全文读;如果只做 CNN/Mamba backbone,优先读方法和消融部分即可。重点看 T-PatchMix 的伪标签同步逻辑和 ITCL 的 soft positive 构造。


论文 2:Evaluation of Anatomical Shape Priors in Deep Learning-Based Cardiac Multi-Compartment Segmentation

基本信息

  • 标题:Evaluation of Anatomical Shape Priors in Deep Learning-Based Cardiac Multi-Compartment Segmentation
  • 作者 / 第一作者:Michael Hudler, Franz Thaler, Martin Urschler / Michael Hudler
  • 时间:2026-05-15 arXiv v1;论文首页标注发表于 Proceedings of the Third Austrian Symposium on AI, Robotics, and Vision (AIRoV 2026)
  • 来源:arXiv preprint / AIRoV 2026 proceedings
  • 论文页面链接:https://arxiv.org/abs/2605.15707
  • PDF 文件 / PDF 链接:/tmp/medseg_daily_2026-05-19/shape_priors_2605.15707.pdf;https://arxiv.org/pdf/2605.15707
  • 代码链接:未获取;PDF 与 arXiv 页面未确认官方代码
  • 任务:whole-heart multi-compartment CT segmentation,7 个心脏/大血管前景类别 + 背景
  • 数据集:MM-WHS CT、WHS++ CT
  • 方法类型:负结果/评估研究;3D U-Net baseline;shape-aware losses;population heatmap-guided U-Net variants;anatomical prior evaluation

paper-deep-reader 精读结果

1. 一句话结论

这篇论文最重要的价值是给出一个清晰的负结果:在 MM-WHS/WHS++ whole-heart CT 分割中,强 3D U-Net 已经学到相当多隐式解剖规律,简单手工体积、矩、质心关系或平均 heatmap 先验并不能稳定超过 baseline。

2. 研究背景与核心问题

论文研究 whole-heart multi-compartment CT segmentation,目标是分割左/右心室、左/右心房、心肌、升主动脉、肺动脉等多结构。这个任务对心功能定量、治疗计划、仿真建模和图像引导干预很重要。

医学图像分割中,一个长期问题是:CNN/U-Net 主要依赖 appearance-driven learning,缺少显式解剖形状约束;而传统统计形状模型强调 anatomical plausibility。作者的问题是:在现代 3D U-Net 已经很强的情况下,轻量手工 shape prior 是否还能带来可测量增益?

这是一篇偏 evaluation/negative result 的论文,不是提出一个复杂新网络。它的 paper map 可以概括为:研究 cardiac CT multi-compartment segmentation;主动作是把多类形状先验作为 loss 或 heatmap architecture 加到 3D U-Net 上;主张是这些简单显式先验没有稳定提高性能;证据来自 MM-WHS 与 WHS++ 的 Dice/Jaccard/HD/ASSD 对比;主要失败风险是实验规模较小、实现细节依赖 thesis/补充材料,结论可能只适用于特定数据集和先验形式。

3. 现有方法不足

作者认为标准 3D U-Net 的不足是没有显式编码解剖可行性,例如器官体积范围、质心关系、空间布局、平均形状分布等。因此,理论上它可能产生解剖不合理 mask。传统 statistical shape models 可以编码形状,但通常工程复杂,难以直接融入深度网络训练。

不过,论文的核心发现反过来挑战了这个动机:在当前 whole-heart 数据集上,baseline 3D U-Net 通过图像、数据增强、多尺度 encoder-decoder 和 skip connection 已经隐式学到全局结构,剩下错误更多集中在边界和薄结构;粗粒度 shape prior 对这些局部误差帮助有限。

4. 方法总览

论文以标准 3D U-Net 为参照,评估两类显式形状先验:

  1. Shape-aware losses:不改 backbone,只在 baseline Generalized Dice + Cross-Entropy 外加入形状正则。
  2. Architectural priors:从训练标签配准得到 population-level multi-class probability heatmaps,并把这些 heatmap 用辅助头、双 decoder、双 encoder 或 cascade 的方式融入 U-Net。

数据预处理包括:把 CT 和标签重定向到共同解剖约定、等体素重采样、用 label centroid 居中、嵌入标准 field of view,并用 Procrustes alignment 从训练标签构造 population heatmaps。

Baseline 是标准 3D U-Net:单通道 CT 输入,8 个输出类(含背景),encoder-decoder + skip connection,base channels=64,下采样后通道翻倍,LeakyReLU,使用 Generalized Dice + Cross-Entropy loss。

5. 核心模块拆解

模块 A:Volume regularization
输入是 soft prediction 的各类别体积,约束其不要偏离训练集估计的类别体积均值和标准差。它解决的是“器官太大/太小”的全局问题。创新性较低,但解释性强。适合小样本或极端异常检测;但在正常 whole-heart CT 中,体积变异较复杂,单一均值/方差约束可能过粗。

模块 B:Moment-based shape regularization
比较预测 mask 的 soft 一阶/二阶空间矩与训练集参考矩,例如 centroid、ellipsoid-like shape moments。它试图约束结构位置和粗略形状。实验中它在 WHS++ Dice 上略高于 baseline,但幅度很小,MM-WHS 上基本持平。

模块 C:Anatomical relation loss
约束类别质心之间的 pairwise distances 和 angular relations。它的目标是保持心脏多结构之间的空间关系,但 MM-WHS 上 Dice 从 baseline 90.85 降到 88.98,说明过硬或过粗的关系约束可能和真实变异/配准误差冲突。

模块 D:Population heatmap-guided architectures
作者测试了多个结构:最后 decoder 层辅助 heatmap prediction head、multi-layer deep supervision heatmap、2-Decoder(一个 segmentation decoder,一个 heatmap decoder)、2-Encoder(图像和 heatmap 双输入)、Cascaded 三个 U-Net 粗到细 refinement。它们把平均解剖位置作为网络额外任务或输入,但多数没有超过 baseline。

这些模块对其他医学分割框架的迁移价值在于:它们是容易实现的 “shape prior baseline”,可作为你评估更复杂 topology/diffusion/flow prior 是否真正有用的对照组;但不建议直接作为 polyp segmentation 或 DAMamba 的核心创新,因为结果显示其收益不稳定。

6. 实验设计与结果

数据与设置:

  • MM-WHS CT:20 个 annotated CT 训练,40 个 hidden-label CT 测试;7 个前景类别。
  • WHS++ CT:使用其训练集后半部分 20 个 CT case 作为可访问 ground truth 的补充评估。
  • 输入 resolution 测试了 64^3128^3 crop;所有结构使用相同几何与强度增强。
  • 指标包括 Dice、Jaccard、Hausdorff Distance(HD)、Average Symmetric Surface Distance(ASSD);WHS++ 主要汇总 Dice 等可用指标。

关键结果:

  • MM-WHS CT, 64³, shape-aware losses:baseline Dice 90.85,volume regularization 90.85,moment regularization 90.84,anatomical relation 88.98。也就是说,体积/矩基本持平,关系 loss 明显变差。
  • MM-WHS CT, 64³, architecture priors:baseline Dice 90.85;HM multilayer 90.60;2-Decoder 90.73;Cascaded 90.32。没有超过 baseline,尽管 Cascaded 的 HD 略优(7.55 vs 7.64 mm)。
  • MM-WHS CT, 128³:baseline Dice 92.05;2-Encoder 92.02;Cascaded 92.04,几乎追平但未超过 baseline。
  • WHS++ CT, 64³:baseline Dice 88.93;volume 89.09;moment 89.16;anatomical relation 88.66。loss prior 有极小提升,但不稳定;architecture prior 中 HM multilayer 88.72、2-Encoder 87.75、Cascaded 86.13,均不如 baseline。
  • 定性结果显示 baseline、shape loss、2-Decoder 都能恢复全局心脏结构,差异主要在边界和小结构。

7. 实验可信度判断

这篇的证据价值在于“负结果清楚、baseline 强、比较直接”。它没有夸大新方法,而是实证说明简单 shape prior 不稳定。

可信点:

  • 使用公开且经典的 whole-heart segmentation 数据集;
  • baseline 是强 3D U-Net,且结果与 MM-WHS/WHS++ 相关挑战中的强方法相近;
  • 同时测试 loss prior 与 architecture prior,避免只否定一种实现;
  • 同时报告 overlap 和 boundary metric,注意到某些方法可能改善 HD 但不改善 Dice。

局限:

  • 论文正文很短,很多实现细节指向 thesis;
  • 样本量较小,MM-WHS/WHS++ 本身并不覆盖所有心脏变异;
  • 手工先验较粗,不能代表 learned anatomical prior、diffusion prior、flow matching prior 或 topology-aware prior;
  • 没有代码,难以确认训练 recipe、公平性和调参范围;
  • 负结果不应推广到所有医学分割,尤其不适用于拓扑极其关键的血管、气道、神经纤维、息肉边界或肿瘤不规则形态场景。

8. 与主流医学图像分割框架的关系

  • U-Net/3D U-Net/nnU-Net:它强化了一个重要判断:强 3D U-Net baseline 很难被简单先验模块击败。做新框架时必须严肃对比 U-Net/nnU-Net,而不能只比较弱 baseline。
  • MedNeXt:MedNeXt 等现代 CNN backbone 可能更强,因此简单 shape prior 的边际收益可能更小;但 learned prior 与 boundary-aware decoder 仍可能有价值。
  • UNETR/Swin-UNet/Transformer:论文没有验证 Transformer,但其结论提醒:长程依赖或全局 prior 不等于自动提升,必须证明对局部边界/小结构有帮助。
  • Mamba/VMamba/SegMamba/DAMamba:同样没有验证 Mamba;对 DAMamba 的启发是,不要只声称 Mamba 捕获全局形状,要用强 3D U-Net 或 nnU-Net 比较,并加入边界/HD/ASSD 证据。
  • foundation medical segmentation:它不属于 SAM/MedSAM 方向;但可作为 foundation model adaptation 中“显式先验是否真的有用”的反面证据。

9. 对我课题的价值

这篇对你的研究很有方法论价值:

  1. 作为 related work/实验设计警示:如果你要在 DAMamba 或 U-Net 里加入 topology/shape/anatomical prior,必须证明它超过强 baseline,而不是只讲先验合理。
  2. 作为 baseline 设计参考:volume、moment、centroid relation、heatmap prior 可以作为简单 prior baselines,用来衬托更强的 learned prior 或 boundary-aware module。
  3. 对 polyp segmentation 的间接启发:息肉形态变化大,粗均值形状先验可能更不适合;更有希望的是 boundary-aware、uncertainty-aware、texture/illumination-aware 或 foundation distillation,而不是强行加入固定 shape prior。

10. 阅读建议

建议精读,但以“负结果和实验设计”角度读。如果你正在写 introduction/related work,可以引用它说明显式先验并非免费收益;如果你正在设计 DAMamba/拓扑约束模块,应重点读 Methods 和 Results,借鉴其 baseline-first 的验证态度。


今日推荐优先级

  1. Semi-MedRef:更值得优先读。它有明确机制、较完整消融、与低标注/文本提示/foundation medical segmentation 方向更接近,适合扩展到医学 referring segmentation 或半监督训练策略。
  2. Evaluation of Anatomical Shape Priors:更适合作为负结果与实验设计参考。它对“强 U-Net baseline + 形状先验是否有必要”给出清晰证据,适合写 related work 和设计 ablation。

今日 PDF 获取情况

  • 论文 1:已附 PDF;本地文件 /tmp/medseg_daily_2026-05-19/semi_medref_2605.15720.pdf,可访问 PDF 链接:https://arxiv.org/pdf/2605.15720
  • 论文 2:已附 PDF;本地文件 /tmp/medseg_daily_2026-05-19/shape_priors_2605.15707.pdf,可访问 PDF 链接:https://arxiv.org/pdf/2605.15707

今日可执行建议

  1. 先读 Semi-MedRef 的方法与消融:尤其 T-PatchMix 如何同步图像 patch、伪 mask 和文本位置 span;这个思想可迁移为 lesion-aware Copy-Paste 或 anatomy-aware augmentation。
  2. 把 shape prior 论文作为 baseline 警示加入笔记:如果后续做 DAMamba + topology/shape prior,实验中应加入 strong 3D U-Net/nnU-Net,并报告 Dice、HD、ASSD,而不是只报告单一 Dice。
  3. 不要把两篇都当作直接 polyp backbone:Semi-MedRef 更偏文本/半监督训练策略,shape prior 更偏心脏 3D 负结果;对息肉分割可借鉴的是边界/伪标签/增强验证逻辑,而不是直接复现完整框架。

参考链接

  • Semi-MedRef arXiv:https://arxiv.org/abs/2605.15720
  • Semi-MedRef PDF:https://arxiv.org/pdf/2605.15720
  • Evaluation of Anatomical Shape Priors arXiv:https://arxiv.org/abs/2605.15707
  • Evaluation of Anatomical Shape Priors PDF:https://arxiv.org/pdf/2605.15707
此作者没有提供个人介绍。
最后更新于 2026-05-19