2026-05-13 医学图像分割论文精读:GeoProto 与 XTinyU-Net

503611908 发布于 10 小时前 14 次阅读


今日医学图像分割最新论文精读追踪

今日结论

今天 arXiv 在 2026-05-10 到 2026-05-11 新增了多篇医学图像分割相关预印本;去重后,最值得关注的是一篇跨域 few-shot segmentation 方法论文 GeoProto,以及一篇非常贴近 U-Net / nnU-Net 工程实践的轻量化选择论文 XTinyU-Net。整体趋势是:一方面继续围绕跨域泛化、少标注和 foundation model 适配展开,另一方面也开始重新审视“标准 U-Net/nnU-Net 经合理缩放是否比复杂轻量模块更有效”。

检索说明

今天优先检索了 arXiv 2026-05-01 至 2026-05-13 的 medical image segmentationsegmentation + medical/CT/MRIpolyp segmentationMamba + medical image segmentationnnUNet + segmentation 等查询,并参考了论文 PDF 正文、arXiv 元数据与官方代码链接可达性。当天没有检索到已正式标注为 MICCAI/CVPR/ICCV/ECCV/NeurIPS/ICLR/AAAI/IJCAI/ISBI 或顶刊接收的全新分割论文,因此今日入选均为 2026 年 arXiv preprint;两篇均满足“2025 年及以后”要求。已检查历史推荐记录并排除了重复论文;本次跳过的历史推荐候选包括 ZScribbleSeg、Topology-Constrained Quantized nnUNet、One Sequence to Segment Them All、Sharpening Lightweight Models for Generalized Polyp Segmentation 等。


论文 1:Geometry-aware Prototype Learning for Cross-domain Few-shot Medical Image Segmentation

基本信息

  • 标题:Geometry-aware Prototype Learning for Cross-domain Few-shot Medical Image Segmentation
  • 作者 / 第一作者:Feifan Song, Yuntian Bo, Haofeng Zhang / 第一作者 Feifan Song
  • 时间:2026-05-11
  • 来源:arXiv preprint, arXiv:2605.10885v1
  • 论文页面链接:https://arxiv.org/abs/2605.10885
  • PDF 文件 / PDF 链接:https://arxiv.org/pdf/2605.10885v1 (已下载:MEDIA:/tmp/medseg_daily_20260513/geometry_prototype.pdf)
  • 代码链接:https://github.com/FeifanSong/Geoproto (页面可访问;论文正文写作 https://github.com/FeifanSong/Geoproto.git
  • 任务:Cross-domain few-shot medical image segmentation;1-way 1-shot 设置;跨模态、跨序列、跨上下文分割
  • 数据集:Abdominal CT(MICCAI 2015 Multi-Atlas Labeling Challenge)、Abdominal MRI(ISBI 2019 CHAOS T2-SPIR)、Cardiac b-SSFP / LGE(MICCAI 2019 Multi-sequence Cardiac MR Segmentation Challenge)、MI-PMR prostate MRI、Chest X-Ray、ISIC2018
  • 方法类型:prototype-based few-shot segmentation;geometry-aware prototype enrichment;domain generalization / cross-domain few-shot

paper-deep-reader 精读结果

1. 一句话结论

GeoProto 的核心价值在于把“器官从边界到中心的 ordinal geometry”显式注入 few-shot prototype matching,使跨模态/跨序列时的 support-query 匹配不只依赖容易受域偏移影响的外观特征,而多了一个来自 mask、无需额外标注的结构锚点。

2. 研究背景与核心问题

论文研究 cross-domain few-shot medical image segmentation(CD-FSMIS):模型在源域 base categories 上 episodic 训练,推理时要在未见过的目标域和 novel categories 上,仅用少量 support mask 分割 query。这个问题比普通医学图像分割更贴近临床现实:不同医院、扫描仪、模态、序列和解剖区域带来强 domain shift,而逐任务重新标注和训练代价很高。论文的 paper map 可概括为:它研究 CD-FSMIS;主要动作是从 support mask 构造 distance-to-boundary ordinal strata,并通过 Ordinal Shape Branch 与 Geometry-Aware Prototype Enrichment 给 local prototypes 加几何偏移;作者声称这能在跨模态、跨序列、跨上下文 setting 中超过 RobustEMD、FAMNet、C-Graph 等方法;证据主要来自 7 个数据集、3 类跨域评估和消融;关键风险是“几何结构跨个体/跨病灶稳定”这个假设在形态变异强、病灶边界不规则或非器官目标上可能失效。

3. 现有方法不足

作者认为现有 FSMIS / CD-FSMIS 方法的问题不是没有 prototype,而是 prototype 主要由 encoder 特征平均或局部聚合得到,容易把 anatomy structure 和 domain-specific appearance 混在一起。RobustEMD、FAMNet、C-Graph 等跨域方法通过纹理抑制、频带匹配或 prototype graph 减轻 domain shift,但论文指出这类“抑制域特征”的思路可能同时损失关键结构信息。GeoProto 的替代视角是:不要只压制域差异,而要引入一个跨域更稳定的匹配坐标系,即 organ boundary-to-centroid 的几何层级。

4. 方法总览

论文路线为 method-algorithm,证据重点是 experimental-eval、ablation-and-mechanism-isolation、robustness-and-ood。整体框架如下:

  1. 使用共享 ResNet-101 backbone 编码 support image 和 query image,得到特征 F^s, F^q ∈ R^{C×h×w}
  2. 对 support mask 计算 Euclidean distance-to-boundary transform(EDT),并把前景像素从边界到中心均匀量化为 K 个 ordinal bins;bin 0 近边界,bin K-1 近中心。
  3. Ordinal Shape Branch(OSB)从 support feature 预测每个前景像素的 bin distribution,并用前景 cross-entropy 加 ordinal distance penalty 训练,使预测的几何 embedding 随距离层级平滑、单调变化。
  4. Geometry-Aware Prototype Enrichment(GAPE)把 support feature map 划成 G×G 局部网格,每个有效前景 cell 做 masked-average pooling 得到 local appearance prototype。
  5. 对每个 cell 计算其期望 ordinal stratum \bar d_i = mean_x Σ_k k p_k(x),再经两层 MLP ϕ(\bar d_i/(K-1)) 得到 C 维几何 offset e_i
  6. enriched prototype 为 p'_i = p_i^fg + e_i;背景 prototype 不做几何增强,因为背景没有 organ-interior geometry。
  7. query pixel 用 softmax-weighted cosine similarity 与 enriched foreground prototypes、background prototypes 匹配,输出 segmentation mask。
  8. 总 loss 包括 query segmentation CE、bidirectional prototype alignment loss,以及 λ_geo L_OSB

5. 核心模块拆解

  • EDT ordinal bin construction:输入是 support binary mask,输出是每个前景像素的离散几何层级 Z ∈ {0,…,K-1}。它解决的是 prototype 不知道“来自器官边缘还是中心”的问题。创新不在 EDT 本身,而在把 EDT 变成 few-shot prototype 的显式结构条件。
  • Ordinal Shape Branch(OSB):输入 support feature,输出 K-bin logits / distribution。L_cls 只看 bin 分类是否正确,L_dist 按预测 bin 与真实 bin 的 ordinal gap 加权,鼓励相邻层级的平滑过渡。这个模块的创新点较明确,尤其是把 ordinal consistency 用作结构监督;但它依赖 support mask 质量,mask 噪声或边界粗糙会直接影响几何监督。
  • Geometry-Aware Prototype Enrichment(GAPE):输入 local appearance prototype 和该 cell 的 expected stratum,输出 enriched prototype。它通过加法 offset 改变 prototype feature space,使外观相似但几何位置不同的局部 prototype 被区分开。对 U-Net / nnU-Net 主干不是即插即用,因为它服务于 prototype matching;但对 few-shot、prompt-based 或 memory-prototype segmentation 框架很有迁移价值。
  • Bidirectional alignment regularizer:用 query 预测 mask 反过来 segment support,稳定 feature space。作者刻意不在 alignment 分支用 geometry enrichment,以避免 GAPE 与 alignment 的循环依赖。
  • 是否适合 polyp segmentation / 3D segmentation:对普通 supervised polyp segmentation 的直接价值有限,因为息肉形态、遮挡、扁平病灶和边界不规则会削弱“同类目标有稳定 interior strata”的假设;但对 few-shot polyp、跨中心 colonoscopy domain shift 或 prototype-based polyp adaptation 可借鉴。3D segmentation 中 EDT 可以自然推广到 3D distance transform,但计算和 memory-prototype 设计需重做。

6. 实验设计与结果

实验覆盖三类设置:

  • Cross-modality:Abdominal CT ↔ MRI,器官包括 liver、left kidney、right kidney、spleen。GeoProto 在 CT→MRI mean DSC 69.45%,MRI→CT mean DSC 69.65%;相较 C-Graph 在 CT→MRI 的 67.38% 有小幅提升,在 MRI→CT 相较 C-Graph 67.20% 也有提升。
  • Cross-sequence:Cardiac LGE ↔ b-SSFP。GeoProto 在 LGE→b-SSFP mean DSC 74.23%,与 C-Graph 74.20% 基本持平;在 b-SSFP→LGE mean DSC 67.10%,高于 C-Graph 63.33% 和 FAMNet 61.39%。
  • Cross-context:训练于 Abdominal CT,测试到 CXR、ISIC、Cardiac b-SSFP MRI、MI-PMR。GeoProto 在 CXR、Cardiac b-SSFP、MI-PMR 上表现较强,例如 MI-PMR mean DSC 61.24%,高于 C-Graph 50.10%;但在 ISIC 上 47.45% 低于 C-Graph 50.42%。

消融方面,作者比较 baseline、位置编码 PE、Geo-E without OSB-L、OSB-L without Geo-E 和完整模型。完整模型在 Abdominal MRI 上 69.45%,比 baseline 63.01% 提升 6.44;在 Cardiac b-SSFP 上 61.03%,比 baseline 45.59% 提升 15.44。K-bin 消融显示 K=10 综合最好;fusion mode 中 additive fusion 整体优于 concat projection 和 scale gate。效率表显示 GeoProto 43.4M 参数,test latency 12.87ms,低于 FAMNet 22.72ms 和 C-Graph 147.39ms。

7. 实验可信度判断

可信之处:数据集和 transfer settings 覆盖面较广;baseline 包括 RobustEMD、FAMNet、C-Graph 等 CD-FSMIS 相关方法;消融不是只删一个模块,而是验证了 geometry prior、OSB-L、bin 数量、fusion mode 和复杂度。尤其 Fig. 3 对 EDT bin 分布和 support-query Bhattacharyya coefficient 的分析,直接回应了“几何是否稳定”的核心假设。

需要谨慎之处:第一,所有结果都是 1-way 1-shot,尚不清楚多 shot、不同 support 采样方差和更真实临床 episode 下是否稳定;第二,主要指标是 DSC,缺少统计显著性检验和置信区间;第三,geometry prior 对高度变形病灶、术后结构、肿瘤浸润边界、扁平息肉等目标未被充分验证;第四,backbone 使用 MS-COCO 初始化 ResNet-101,和现代 MedSAM / SAM2 / DINO / Mamba 类 backbone 的关系还没展开。

8. 与主流医学图像分割框架的关系

  • U-Net / nnU-Net:GeoProto 不是经典 encoder-decoder 全监督框架,也不是 nnU-Net recipe 改进;它关注 few-shot prototype matching。可借鉴的是 geometry-aware local prototype,而不是整体替代 nnU-Net。
  • MedNeXt / CNN segmentation:可把其思想用于 CNN feature prototype 或 memory bank,使 CNN 特征带上边界-中心结构条件。
  • UNETR / Swin-UNet / TransUNet / TransFuse:论文当前 backbone 是 ResNet-101,不是 Transformer segmentation 架构;但 geometry offset 可以理论上加到 Transformer token prototype 或 prompt token 上。
  • Mamba / VMamba / SegMamba / DAMamba:GeoProto 不涉及 state space module;但它提供了一个 orthogonal idea:在 Mamba/CNN encoder 之外,用 distance-transform geometry 对 prototype 或 decoder query 做条件化。对 DAMamba 改造的启发是:可以把 boundary-to-centroid ordinal map 作为辅助监督或 gating signal,而不是只依赖 sequence scanning。
  • Foundation model segmentation:和 SAM/MedSAM 的 promptable segmentation 有潜在连接:support mask 的 EDT geometry 可以作为 prompt prototype 的结构先验,但论文没有直接验证 foundation model 场景。

9. 对我课题的价值

如果用户关注 polyp segmentation 和 DAMamba,GeoProto 的直接 baseline 价值不如 U-Net/nnU-Net 类论文,但概念价值较高:它提醒我们在跨域分割中,boundary-aware 或 center-aware geometry 可以比单纯加注意力、Mamba block 更有解释力。对息肉任务,可考虑把 EDT/边界距离图作为辅助分支、boundary-to-interior ordinal supervision、或在 prototype/memory-based polyp adaptation 中加入几何偏移。对 DAMamba,可尝试把 distance strata 作为 decoder-side gating 或 scan-order bias,尤其用于提升边界与内部一致性。

10. 阅读建议

建议精读。理由是方法机制清楚、实验覆盖多个跨域 setting、消融能支撑核心假设;但若当前目标是构建常规全监督 polyp segmentation 主干,它不是最优先 baseline,应作为“跨域 few-shot / geometry prior / prototype matching”方向的启发文献阅读。


论文 2:XTinyU-Net: Training-Free U-Net Scaling via Initialization-Time Sensitivity

基本信息

  • 标题:XTinyU-Net: Training-Free U-Net Scaling via Initialization-Time Sensitivity
  • 作者 / 第一作者:Alvin Kimbowa, Moein Heidari, David Liu, Ilker Hacihaliloglu / 第一作者 Alvin Kimbowa
  • 时间:2026-05-10
  • 来源:arXiv preprint, arXiv:2605.09639v1
  • 论文页面链接:https://arxiv.org/abs/2605.09639
  • PDF 文件 / PDF 链接:https://arxiv.org/pdf/2605.09639v1 (已下载:MEDIA:/tmp/medseg_daily_20260513/xtiny_unet.pdf)
  • 代码链接:论文和 arXiv 页面给出 https://github.com/alvinkimbowa/nntinyunet.git ,但今日访问对应 GitHub 页面返回 404;因此代码“声称公开”,但当前未确认可用
  • 任务:轻量化医学图像分割;训练前选择 dataset-specific U-Net width scaling configuration
  • 数据集:BUS-BRA、EchoNet Dynamic、ISIC 2018、FiVES、BraTS2020、ACDC
  • 方法类型:U-Net / nnU-Net width scaling;zero-cost / training-free architecture selection;lightweight segmentation

paper-deep-reader 精读结果

1. 一句话结论

XTinyU-Net 的重要价值不是发明新 block,而是提出一个很实用的判断:在 nnU-Net 框架内仅做 width scaling,并用初始化时的 Jacobian sensitivity 找到“性能崩塌前的最小 U-Net”,可能比许多复杂轻量化架构更省参数且不牺牲 Dice。

2. 研究背景与核心问题

论文研究资源受限医学图像分割:U-Net/nnU-Net 很强,但完整模型在移动设备、床旁系统、基层医院或实时场景中参数和 FLOPs 过高;手工设计 lightweight architecture 又往往需要大量 train-and-evaluate sweep。paper map 可概括为:它研究如何在不训练候选模型的情况下,为特定医学分割数据集选择足够小但尚未容量崩塌的 U-Net;主动作是构造 width-capped U-Net family,并用初始化时输入-输出 Jacobian sensitivity 曲线的 total variation 检测 collapse boundary;作者声称 XTinyU-Net 在 6 个数据集上接近或超过 nnU-Net Dice,同时参数少 400×–1600×,并优于 UNeXt、CMUNeXt-S、TinyU-Net;证据来自 nnU-Net 协议下 6 个公开数据集、三次运行均值方差、轻量 baseline 对比和 NAS metric 消融;主要风险是 Jacobian collapse boundary 与真实性能崩塌的关联可能依赖模型族、预处理、patch size 和数据集,尚未在 3D 全分辨率或更复杂任务上充分验证。

3. 现有方法不足

作者批评两类现状:第一,轻量化模型如 UNeXt、CMUNeXt、TinyU-Net、LeanUNet、MedNCA 等通过新 block、简化 decoder、token mixing 等降低参数,但往往没有解决“不同数据集需要不同容量”的选择问题;第二,zero-cost NAS 指标多面向分类或宏观架构排序,在医学 dense prediction 中对同一 U-Net 家族的细粒度容量变化不够敏感。论文认为真正实用的问题是:对给定数据集,U-Net 可以缩到多小而不崩?

4. 方法总览

论文路线为 method-algorithm,证据重点是 experimental-eval、reproducibility-and-compute、ablation-and-mechanism-isolation。方法步骤如下:

  1. 固定 U-Net / nnU-Net 的空间层级、stage 数、下采样路径和训练 recipe,只改变 channel width。
  2. 设 baseline 第 l 层通道数为 C_l^base = 2^l C_0,baseline 最大通道 C_max^base = C_{L-1}^base
  3. 构造离散模型族:C_max(i)=C_max^base / 2^i,每层通道 C_l(i)=min(2^l C_0, C_max(i))。论文采用 C_max^base=512,形成 10 个候选模型,index 越大模型越小。
  4. 对每个未训练模型 M_i,取少量未标注输入图像,计算输出对输入的梯度:g_i(x)=∇_x Σ_u f_i(x;θ_i)_u,并用 ||g_i(x)||_2 的 RMS 聚合为 sensitivity score S_i
  5. 对所有候选的 S_i 做 min-max normalize,计算相邻模型 sensitivity 差分 d_i=|S_{i+1}-S_i|
  6. 对候选 split k,比较大模型区和小模型区的 total variation,选择使 pre-collapse 区稳定、post-collapse 区波动大的边界 k*,最终选 M_{k*} 作为 XTinyU-Net。

5. 核心模块拆解

  • Width-capped U-Net family:输入是 nnU-Net baseline 配置,输出是一组只改变最大 channel cap 的 U-Net。它保留空间拓扑和 receptive field,因此把变量尽量限制为 capacity,而不是混入 depth、kernel、decoder 设计差异。这一点对公平研究很关键。
  • Jacobian sensitivity score:输入少量未标注图像和随机初始化模型,输出每个模型的 input-output sensitivity。直觉是过窄模型在容量边界附近会对输入扰动更敏感,曲线变化更剧烈。它不需要 label,也不需要训练,因此适合快速模型选择。
  • Total-variation collapse detector:不是把 sensitivity 当“越大越好”的 NAS 分数,而是找 sensitivity 曲线从平稳到剧烈变化的边界。这个设计是论文相对普通 zero-cost NAS 的主要差异。
  • XTinyU-Net selected configuration:不是固定架构,而是每个数据集一个选出来的最小 pre-collapse U-Net。因此它更像一个选择算法,而不是单一模型。
  • 是否适合迁移到 polyp / 3D:对 polyp segmentation 很适合尝试,因为息肉分割常用 2D U-Net/UNet++/PraNet/轻量模型,且部署实时性重要;只要能在 colonoscopy 数据上构造 width family,就能用未标注图像先筛一个容量边界。对 3D segmentation 也有潜力,但 3D Jacobian 计算内存更高,且论文当前实验未证明 3D nnU-Net 全流程有效。

6. 实验设计与结果

论文在 nnU-Net training/evaluation protocol 内比较,报告 Dice 和 HD95,并给出三次运行 mean±std。数据集包括乳腺超声 BUS-BRA、EchoNet Dynamic 心超、ISIC2018 皮肤病灶、FiVES 视网膜血管、BraTS2020 脑肿瘤、ACDC 心脏 MRI。

关键结果:

  • 在 BUS-BRA 上,XTinyU-Net 只有 20.39k 参数、0.92G FLOPs,但 Dice 90.64±7.57,高于 nnU-Net 的 89.90±10.25;参数从 33,472.40k 降到 20.39k,超过 1600× 减少。
  • EchoNet Dynamic 上 XTinyU-Net Dice 92.31±3.94,接近 nnU-Net 92.45±4.16,HD95 3.78 与 nnU-Net 3.75 接近。
  • ISIC2018 上 XTinyU-Net Dice 89.39±12.38,高于 nnU-Net 87.84±12.19。
  • FiVES 上 XTinyU-Net Dice 88.97±10.42,略高于 nnU-Net 88.57±10.03,参数 79.55k、FLOPs 1.96G。
  • BraTS2020 上 XTinyU-Net Dice 89.47±11.30,低于 nnU-Net 91.19±11.17,但远高于 UNeXt、CMUNeXt-S、TinyU-Net。
  • ACDC 上 XTinyU-Net Dice 91.86±6.06,接近/略高于 nnU-Net 91.37±6.01,HD95 2.53 与 nnU-Net 2.27 接近。

消融显示,Jacobian-based collapse detection 对 batch size 和 random initialization 有一定鲁棒性;NASWOT、SWAP 等已有 zero-cost metrics 往往随模型容量单调变化,因此不能定位 sharp pre-/post-collapse transition。

7. 实验可信度判断

可信之处:论文避免了“换新模块 + 换训练 recipe”的混杂,把所有模型放在 nnU-Net 协议下比较;报告了 Dice/HD95 和三次运行均值方差;baseline 包括 UNeXt、CMUNeXt-S、TinyU-Net,也包括完整 nnU-Net 作为 upper/reference bound。结论“很多数据集上标准 U-Net 缩宽后已足够强”有较强工程意义。

不足之处:第一,论文目前是 arXiv preprint,代码链接今日未能访问,复现性暂时打折;第二,虽然说 within nnU-Net framework,但实验看起来主要是 2D 或切片级任务,并没有充分展示 3D full-resolution nnU-Net 的显存、patch、spacing、cascade 细节;第三,collapse detector 的数学形式在 PDF 中 TVL/TVR 区域命名略容易混淆,且选择 argmax |TVR-TVL| 的理论解释仍偏经验;第四,参数极低时 Dice 接近 nnU-Net 这一现象很吸引人,但需要在更多多类别、小目标、低对比病灶任务上验证是否仍成立。

8. 与主流医学图像分割框架的关系

  • U-Net / nnU-Net:这是论文的中心。它不是替代 U-Net,而是把 U-Net 的 width 当作 dataset-specific capacity knob,在 nnU-Net recipe 下寻找最小可用配置。
  • MedNeXt:MedNeXt 代表大 kernel ConvNeXt-style 现代 CNN 分割框架;XTinyU-Net 提醒我们在引入复杂 CNN block 前,应先比较 properly scaled nnU-Net,否则可能高估新结构价值。
  • UNETR / Swin-UNet / TransUNet / TransFuse:论文不直接涉及 Transformer;但它的观点对 Transformer-based segmentation 也是警示:轻量化不一定要先换 token mixer,先做容量边界搜索可能更有性价比。
  • Mamba / VMamba / SegMamba / DAMamba:论文与 Mamba 无直接关系,但对 DAMamba 研究非常有参考价值:如果要证明 DAMamba block 有价值,必须和强且经过容量调优的 tiny U-Net / nnU-Net 比,而不是只和未调优 heavy U-Net 或随意轻量 baseline 比。
  • Foundation model segmentation:与 MedSAM/SAM 类方法不同,XTinyU-Net 走的是小模型部署路线;在无 GPU 或实时场景中,可能比 foundation model 更实际。

9. 对我课题的价值

对用户的 polyp segmentation / DAMamba 方向,XTinyU-Net 的价值很高。第一,它可以作为轻量 baseline:在 CVC-ClinicDB、Kvasir-SEG、CVC-ColonDB、ETIS、EndoScene 等息肉数据上先跑 width-scaled U-Net family,再看 DAMamba 是否真的提升。第二,它提供了一个无需训练的模型选择工具,可快速估计某个数据集需要的最小 channel cap。第三,它能帮助 introduction/related work 中讨论“轻量化医学分割不一定依赖复杂模块,容量选择本身是关键”。

10. 阅读建议

强烈建议精读并尝试复现核心选择器。虽然代码当前未确认可访问,但算法实现并不复杂:构造 10 个 channel cap、计算随机初始化 Jacobian sensitivity、找 total-variation boundary。对后续做 polyp segmentation、DAMamba ablation、公平 baseline 设计都很有直接帮助。


今日推荐优先级

  1. XTinyU-Net: Training-Free U-Net Scaling via Initialization-Time Sensitivity:最适合用户后续医学图像分割研究,尤其是 polyp segmentation、轻量化 baseline、公平 ablation 和 DAMamba 对比实验。它能直接转化为实验策略:先找到 tiny U-Net 容量边界,再评估新模块是否真的有效。
  2. Geometry-aware Prototype Learning for Cross-domain Few-shot Medical Image Segmentation:更适合作为跨域 few-shot、geometry prior、prototype matching 的方法启发。对常规全监督息肉分割不是直接 baseline,但对跨中心/少标注/边界结构建模有较高参考价值。

今日 PDF 获取情况

  • 论文 1:已附 PDF / 提供 PDF 链接:MEDIA:/tmp/medseg_daily_20260513/geometry_prototype.pdf;https://arxiv.org/pdf/2605.10885v1
  • 论文 2:已附 PDF / 提供 PDF 链接:MEDIA:/tmp/medseg_daily_20260513/xtiny_unet.pdf;https://arxiv.org/pdf/2605.09639v1

今日可执行建议

  1. 优先复现 XTinyU-Net 的 training-free width selection:在一个 polyp segmentation 数据集上先用未标注图像计算 Jacobian sensitivity,选出最小 pre-collapse U-Net,再作为 DAMamba 改造的强轻量 baseline。
  2. 从 GeoProto 中抽取 EDT ordinal supervision 思路:可在 polyp segmentation decoder 增加 boundary-to-interior distance bin 辅助头,观察是否提升边界 Dice、HD95 或 mIoU,尤其适合做边界质量消融。
  3. 写 related work 时把 XTinyU-Net 放在 lightweight / efficient U-Net selection,把 GeoProto 放在 cross-domain few-shot / geometry-aware prototype;不要把 GeoProto 当常规 nnU-Net 改进来引用。
此作者没有提供个人介绍。
最后更新于 2026-05-13