2026-05-17 医学图像分割论文精读:SplitFed-CL 与 DuetFair

503611908 发布于 4 小时前 8 次阅读


今日医学图像分割最新论文精读追踪

今日结论

今天检索到的最新医学图像分割论文中,方法创新最值得关注的不是又一个 U-Net 模块堆叠,而是两个更偏“真实部署问题”的方向:一篇处理 Split Federated Learning 场景下多中心不准确标注,另一篇处理医学分割公平性中“组内困难样本被平均值掩盖”的问题。两篇均为 2026 年 arXiv 预印本,均晚于 2025 年,且 PDF 可直接获取;它们对 polyp / DAMamba 主干设计不是直接 backbone 替换,但对弱标注、多中心泛化、临床部署可信性相关章节和实验设计很有参考价值。

检索说明

本次优先检索 arXiv 2026-05-11 至 2026-05-14 新近提交的 medical image segmentation / federated segmentation / fairness segmentation / 3D medical segmentation 论文,并对历史 cron 输出中的已推荐标题与 arXiv ID 做了去重。所有入选论文均为 2025 年及以后论文;由于今天未发现新的已接收 MICCAI/CVPR/ICCV/ECCV/NeurIPS/ICLR 顶会正式分割论文 PDF,最终选择了两篇最新且实验较完整、问题设置更有研究价值的 arXiv preprint。已检查历史推荐记录并排除了重复论文;本次跳过的历史推荐候选包括 Med-DisSeg、SpectraFlow、FEFormer、USEMA、GeoProto、XTinyU-Net、MedCore、TopoMamba、ESICA、SemiSAM-O1 等。

WordPress 发布

  • WordPress 文章链接:待发布后填写
  • WordPress Post ID:待发布后填写

论文 1:SplitFed-CL: A Split Federated Co-Learning Framework for Medical Image Segmentation with Inaccurate Labels

基本信息

  • 标题:SplitFed-CL: A Split Federated Co-Learning Framework for Medical Image Segmentation with Inaccurate Labels
  • 作者 / 第一作者:Zahra Hafezi Kafshgari, Hadi Hadizadeh, Parvaneh Saeedi / Zahra Hafezi Kafshgari
  • 时间:2026-05-11 arXiv v1;论文首页标注将出现在 ICIP 2026 proceedings
  • 来源:arXiv preprint / ICIP 2026 proceedings 标注版本
  • 论文页面链接:https://arxiv.org/abs/2605.11060
  • PDF 文件 / PDF 链接:https://arxiv.org/pdf/2605.11060
  • 代码链接:未获取 / 论文正文未提供明确代码链接
  • 任务:Split Federated Learning 下的医学图像分割,重点是不准确 / 异质标注质量下的鲁棒训练
  • 数据集:Human Embryo 四类显微图像分割;PSFHS 产时经会阴超声 pubic symphysis / fetal head 分割;ISIC / ISIC MultiAnnot++ 皮肤病灶分割
  • 方法类型:SplitFed + student-teacher co-learning + label reliability detection + label correction + consistency regularization + reliability-aware aggregation

paper-deep-reader 精读结果

1. 一句话结论

这篇论文最有价值的地方,是把多中心医学分割中各客户端标注质量不同的问题建模为 SplitFed 训练过程中的可靠样本识别、伪标签修正与可靠性加权聚合问题,而不是只做常规 FedAvg 或简单 noisy-label loss。

2. 研究背景与核心问题

论文研究的是 Split Federated Learning 场景下的医学图像分割:每个客户端保留数据本地,模型被切分为 client front-end、server-side heavy computation 和 client back-end,以兼顾隐私和边缘设备算力。医学分割的现实问题是不同医院、设备、标注者经验会导致标签质量差异,尤其边界区域常有不一致;如果直接把这些客户端一起训练,全局模型会被低质量标签拖偏。

paper map 可概括为:论文研究 SplitFed 医学图像分割中异质不准确标注问题;主线是在 DeepLabV3+ SplitFed 架构中引入全局 teacher、可靠样本阈值、student-teacher 标签修正、consistency loss 和可靠性聚合;声称在两个合成噪声多类分割数据集和一个真实标注噪声 ISIC 数据集上优于 FedAvg、FedMix、FedNCL、ARFL、QA-SplitFed、CELC、DHLC;关键技术对象是 difficulty-guided annotation error simulation、tau 阈值、可靠/不可靠样本集合、修正标签、可靠性权重、可学习 loss 权重;主要风险是噪声模型和 SplitFed 实验规模仍偏受控,未充分证明真实多中心大规模部署下的通信、隐私泄露和泛化表现。

路线记录:Primary adapter = method-algorithm;Secondary adapter = benchmark-evaluation;Evidence packs = general、experimental-eval、robustness-and-ood、reproducibility-and-compute;Route confidence = 高。原因:论文核心是一个训练框架 / 算法,证据主要来自多数据集鲁棒性比较与消融。

3. 现有方法不足

作者指出,已有 noisy-label federated learning 多数面向分类,难以直接迁移到医学分割,因为分割标签错误往往集中在模糊边界、曲率高、弱边缘区域,而不是随机 label flip。已有医学 FL / SplitFed 方法如 FedMix、FedA3I、FedDM、QA-SplitFed、DHLC / CELC 要么处理有限监督和弱监督,要么做 client quality weighting 或 lesion label refinement,但对 SplitFed 下样本级可靠性识别、标签局部修正和客户端聚合质量同时建模不足。作者还批评常见噪声模拟过于简单,如随机标签打乱、基本 dilation / erosion,不能反映人类边界标注错误。

4. 方法总览

整体框架基于 DeepLabV3+,使用 ResNet50 encoder。网络被切分为三段:客户端 front-end 编码输入并上传中间激活;服务器子模型执行重计算;客户端 back-end 解码输出分割 mask。每轮训练中,客户端学生模型更新,全球平均模型作为 teacher 提供稳定预测。

核心训练目标包含三部分:可靠样本的 region loss;不可靠样本经 student-teacher 修正后的 region loss;扰动输入上的 consistency loss。可靠样本直接用原标签训练;不可靠样本先由 student-teacher 修正;扰动输入上的 student 预测要与 teacher 在原输入上的预测保持一致。后续作者把固定 alpha、beta 换成可学习权重,并用 warm-up 避免早期伪标签过强影响。

5. 核心模块拆解

  1. Difficulty-guided 标注错误模拟:作者先用 signed distance function 定义边界窄带,使边界带随目标尺度自适应。然后在边界带内计算三类困难度:弱边缘、模糊、曲率,组合为 difficulty map。再把困难度映射为形变幅度,方向由边界内外 edge evidence 的差异决定,最后形变 SDF 并阈值得到 noisy mask。这个模块的意义是让合成噪声更像真实分割边界错误;创新性比随机腐蚀/膨胀更强,但仍是 hand-crafted noise model。

  2. 可靠 / 不可靠样本识别:对 batch 样本计算 student 与 teacher 的 per-sample region loss,若二者均低于全局阈值 tau,划为可靠集合;若二者均高于 tau,划为不可靠集合。tau 初始较高,让训练早期尽量利用数据;随后由跨客户端 loss 均值和方差组成统计量,再按 performance ratio 加权得到,并随训练逐渐严格。

  3. Student-teacher 标签修正:对不可靠样本,构造 student hard mask、teacher hard mask 与原标签之间的 symmetric difference 区域,只在不一致区域做修正。若 student 或 teacher 在区域内置信度超过阈值 T=0.9,用相应预测替换原标签;否则保留原标签。这个设计适合边界修正,但对系统性错误或 teacher 早期错误有依赖。

  4. 可靠性加权 SplitFed 聚合:客户端上传可靠样本数与可靠子集 loss。服务器计算 data ratio 和 performance ratio,再对 FE/S/BE 三段参数加权平均。相比 FedAvg 按样本量聚合,低损失且可靠样本多的客户端权重更高。

  5. 可学习 loss 权重:论文使用 sigmoid 参数化的 unreliable-label loss 权重与 consistency loss 权重,配合 warm-up 和 EMA normalization,避免人工调 alpha、beta。这对工程复现有意义,但也增加了调参细节。

迁移价值:这些模块不是直接用于 polyp backbone 的结构创新,但 difficulty-guided boundary-noise simulation 与 student-teacher 修正很适合迁移到 polyp segmentation 的弱标注 / noisy annotation 实验;SplitFed 聚合部分适合多中心协作训练,不适合单机 DAMamba 主干改造。

6. 实验设计与结果

实验包含三类数据:Human Embryo 594 张显微图像,四类结构分割,四客户端异质划分;PSFHS 1358 张超声图像,分割 pubic symphysis 和 fetal head,客户端 corruption ratios 为 20%、50%、80%、0%;ISIC / IMA++ 中选取 T2/S2 semi-automated + novice verified 作为真实不可靠标注,T1/S1 expert mask 作为较准确标注,并构建五客户端 0%、50%、50%、80%、60% 噪声场景。模型输入 resize 到 352x352,Adam 学习率 1e-4,5 local epochs / round,100 global epochs,阈值 T=0.9。

主要结果:PSFHS 上 SplitFed-CL full 的 accuracy 0.9788、Dice loss 0.0363、mean IoU 0.9592、PS IoU 0.8805、FH IoU 0.9424,优于 QA-SplitFed、FedAvg、FedMix、FedNCL-V2、ARFL、CELC、DHLC。Human Embryo 上 full method accuracy 0.9451、Dice loss 0.0725、mean IoU 0.8995,高于多种 baseline,并优于 no label correction 和 no consistency loss 消融。ISIC 上 full method accuracy 0.9830、Dice loss 0.1320、FG IoU 0.7641、precision 0.9074、recall 0.9157,接近 clean-label FedAvg 的 FG IoU 0.7641,并优于 QA-SplitFed 0.7432。Figure 3 显示 PSFHS 上估计训练噪声比例接近注入比例:真实 20%、50%、80%、0%,检测为 18.8%、45.6%、74.8%、0.4%。

7. 实验可信度判断

可信点:实验覆盖多类显微图像、超声和皮肤病灶;包含合成噪声与真实标注噪声;baseline 不少,并包括 QA-SplitFed 这一直接相关 SplitFed 方法;消融显示 label correction 与 consistency loss 均有贡献;噪声比例估计和 label correction 可视化支持机制解释。

不足也很明显:第一,正文没有报告随机种子方差 / 置信区间,统计显著性不清楚。第二,大多数噪声仍来自作者自定义的 difficulty-guided 形变,真实临床多中心标注误差可能包含漏标、类别混淆、protocol 差异,不只是边界形变。第三,SplitFed 的通信量、隐私泄露风险、server activation inversion 等没有展开。第四,代码链接未提供,复现难度较高。第五,DeepLabV3+ / ResNet50 为基础模型,未验证 nnU-Net、UNetR、Swin-UNet、MedNeXt、Mamba 系列分割框架下是否同样有效。

8. 与主流医学图像分割框架的关系

它不是 U-Net / nnU-Net / Transformer / Mamba 的新主干,而是训练范式和鲁棒学习框架。与 U-Net / nnU-Net 的关系:可把 SplitFed-CL 的可靠样本识别、标签修正和聚合策略挂到 nnU-Net 或 3D U-Net 的 federated / split-federated 训练上。与 TransUNet / Swin-UNet / UNetR 的关系:如果 server-side 能承载 Transformer bottleneck,它也可用于这些模型,但论文未验证。与 DAMamba / SegMamba 的关系:没有状态空间模块;可借鉴其 noisy-label 和 consistency training 逻辑,为 Mamba-based medical segmentation 设计多中心鲁棒训练实验。与 foundation model 的关系:不依赖 SAM / MedSAM;但 teacher-student label correction 和不可靠标注修正思路可与 foundation model pseudo-label 结合。

9. 对我课题的价值

对 polyp segmentation:中等偏高。它的 boundary-centric error simulation 很适合模拟息肉边界模糊标注;student-teacher correction 可用于 Kvasir-SEG / CVC-ClinicDB / ETIS 等数据的 noisy-label robustness 实验。对 DAMamba 改造:不是结构模块,不能直接作为 DAMamba block,但可作为训练鲁棒性 / 多中心泛化扩展实验。对 introduction / related work:如果要讨论临床部署、多中心隐私训练、不准确标注,这是很好的近期引用。对 baseline:只有在做 federated / split-federated polyp segmentation 时才适合作为 baseline;普通单中心 polyp segmentation 不必强行比较。

10. 阅读建议

建议精读。如果近期目标是主干结构创新,可先读方法和实验表;如果计划写 noisy-label、弱标注、多中心 polyp segmentation 或 clinical deployment 章节,建议全文精读并复现 difficulty-guided noise simulation。


论文 2:DuetFair: Coupling Inter- and Intra-Subgroup Robustness for Fair Medical Image Segmentation

基本信息

  • 标题:DuetFair: Coupling Inter- and Intra-Subgroup Robustness for Fair Medical Image Segmentation
  • 作者 / 第一作者:Yiqi Tian, Sangjoon Park, Bo Zeng, Pengfei Jin, Yujin Oh, Quanzheng Li / Yiqi Tian
  • 时间:2026-05-11 arXiv v1
  • 来源:arXiv preprint
  • 论文页面链接:https://arxiv.org/abs/2605.10521
  • PDF 文件 / PDF 链接:https://arxiv.org/pdf/2605.10521
  • 代码链接:未获取 / 论文正文未提供明确代码链接
  • 任务:公平性医学图像分割;2D fundus optic cup/rim、2D skin lesion、3D radiotherapy target segmentation
  • 数据集:Harvard-FairSeg;HAM10000;in-house 3D pelvic CT prostate radiotherapy CTV cohort
  • 方法类型:fairness-aware segmentation;distribution-aware mixture-of-experts;subgroup-conditioned KL-DRO / robust loss aggregation

paper-deep-reader 精读结果

1. 一句话结论

这篇论文最重要的价值,是把医学分割公平性从组间平均指标差距推进到组间适配 + 组内困难患者不被平均值掩盖的双轴问题,并用 dMoE + subgroup-conditioned DRO 给出一个可实现框架。

2. 研究背景与核心问题

医学图像分割正在进入筛查、诊断、放疗计划等临床环节,模型在不同人口学、临床或机构子群上的表现差异会导致实际风险。例如 glaucoma screening 中 optic cup/rim 边界错误可能影响判断,radiotherapy target segmentation 错误可能漏照病灶或照射健康组织。已有公平性工作往往按 race、age、sex、tumor stage、institution 等预定义 subgroup 计算平均性能并缩小组间差距;但同一 subgroup 内也有图像质量、解剖差异、病灶范围、边界模糊等差异,平均值会掩盖少数高损失患者。

paper map:论文研究公平医学分割中 subgroup 平均性能掩盖组内困难样本的问题;主线提出 DuetFair 双轴机制,并实例化为 FairDRO:用 dMoE 处理 inter-subgroup representation adaptation,用 subgroup-conditioned KL-DRO 处理 intra-subgroup hard sample robustness;声称在 Harvard-FairSeg、HAM10000 和 3D 放疗 CTV 分割中提升 equity-scaled metrics 和 worst subgroup performance;关键技术对象是 subgroup attribute、ERM subgroup risk、dMoE routing、robust risk、KL ambiguity set、ES-Dice / ES-IoU;主要风险是方法依赖训练和推理时可用且可靠的 subgroup 属性,且在 HAM10000 这类主要由组间差异解释的任务上优势不稳定。

路线记录:Primary adapter = method-algorithm;Secondary adapter = benchmark-evaluation;Evidence packs = general、experimental-eval、robustness-and-ood、benchmark-fairness-and-contamination;Route confidence = 高。原因:论文贡献是一个公平性训练目标和架构组合,并用多 benchmark 公平性指标支撑。

3. 现有方法不足

作者认为已有 FairSeg、FairDiff、FairDomain、dMoE 等医学分割公平性方法主要关注 inter-subgroup fairness:按 race、age、domain 或 clinical subgroup 衡量和改善群体平均性能。但 subgroup 内部并不均质,困难病例可能被 subgroup mean 淹没。另一方面,CVaR、tilted ERM、focal loss、OHEM 等 sample-wise robust learning 会关注困难样本,但通常在全局样本池中定义 hard cases,小 subgroup 内部的困难样本仍可能因为数量少而影响不足。论文的核心批评是:单独按 group 或单独按 sample 都不够,公平医学分割需要同时处理组间异质性和组内困难样本。

4. 方法总览

FairDRO 从标准 ERM 写起:标准 ERM 可写成各 subgroup 风险的加权平均。这个式子暴露两层平均:组间由 subgroup frequency 决定,小组影响可能小;组内 subgroup risk 是平均风险,高损失样本可能被低损失样本稀释。作者指出,简单两层 reweighting 在一阶梯度里只体现为 subgroup weight 与 sample weight 的乘积,无法清楚区分“强调 subgroup”还是“强调 subgroup 内困难样本”。因此 FairDRO 把两件事拆开:用 dMoE 在 representation 层处理组间差异;用 subgroup-conditioned DRO 在 loss aggregation 层处理组内困难样本。最终目标是均匀聚合各 subgroup 的 robust risk,不手动偏置某个 subgroup。

5. 核心模块拆解

  1. DuetFair 机制:这不是一个具体 layer,而是问题分解:inter-subgroup axis 关注不同 subgroup 的分布和形态差异;intra-subgroup axis 关注同一 subgroup 内 hard patients。这个视角很有写作价值,因为它能解释为什么单看 subgroup mean 不足以保证患者级可靠性。

  2. dMoE 表征适配:给定样本和 subgroup attribute,在 backbone 中间层取特征,通过 subgroup-conditioned top-K expert routing 添加残差专家变换,然后 decoder 输出 mask。dMoE 的作用是把不同 race / age / tumor stage / institution 的分布差异放在 feature path 中处理,而不是只靠 loss 权重。

  3. Subgroup-conditioned DRO:对每个 subgroup 单独定义 KL ambiguity set。robust risk 是该 subgroup 内所有近邻分布上的 worst-case expected loss。有限样本下,附录给出 log-sum-exp 形式和指数倾斜权重;这意味着高损失样本获得更大梯度权重,但该权重是在 subgroup 内部归一化的,所以小 subgroup 的困难病例不会被全局大 subgroup 样本压掉。

  4. Equity-scaled metrics:论文使用 ES-Dice / ES-IoU,把总体指标按 subgroup 指标偏离总体值的绝对差进行 down-scale。这比只报平均 Dice 更能反映 subgroup disparity。

模块迁移性:dMoE routing 可嵌入 TransUNet、3D U-Net、甚至 Mamba/VMamba encoder 的中间层;DRO loss 是 architecture-agnostic。对 polyp segmentation,若没有明确 demographic / institution subgroup,方法不能直接用;但可把数据集来源(Kvasir、ClinicDB、ETIS、CVC-ColonDB)或成像中心视为 subgroup,研究跨数据集公平 / 泛化。

6. 实验设计与结果

实验覆盖三个 benchmark:Harvard-FairSeg,10,000 张 SLO fundus 图像,optic cup / neuroretinal rim mask,race 分为 Black / Asian / White,测试集 2,000,使用 TransUNet ViT-B;HAM10000,10,015 张 dermoscopy 图像,binary lesion mask,age 分 5 组,测试 1,061,同样使用 TransUNet ViT-B;Radiotherapy Target Dataset,in-house pelvic CT prostate cancer CTV 分割,T-stage subgroup 和 institution subgroup 两种设置,使用 3D Residual U-Net,patch 384x384x128,batch size 4,sliding-window inference。

主要结果:Harvard-FairSeg race / rim 上 FairDRO ES-Dice 0.755、Dice 0.816、ES-IoU 0.639、IoU 0.701;Asian subgroup Dice 从 dMoE 的 0.769 提升到 0.780。cup 分割中 Asian Dice 从 0.844 提升到 0.852。HAM10000 age 上 FairDRO 对 80 岁以上 minority group 相比 dMoE 有提升(Dice 0.864 到 0.876,IoU 0.791 到 0.840),但整体指标不优于 dMoE,作者承认当差异主要是组间时 GDRO 已经很强,FairDRO 额外收益有限。3D radiotherapy / T-stage 上 FairDRO ES-Dice 0.530、Dice 0.665、ES-IoU 0.411、IoU 0.521;相对 dMoE,worst-group Dice 从 T2 的 0.585 提升到 0.620。3D radiotherapy / institution 上 FairDRO ES-Dice 0.589、Dice 0.688、ES-IoU 0.471、IoU 0.554;最难 GN Dice 从 3D ResUNet 的 0.551 / dMoE 的 0.547 提升到 0.592,SC-GN gap 从约 0.18 缩小到约 0.14。消融 Table 6 显示 dMoE-ERM、SG-DRO、FairDRO 三者对比中组合最好,支持双轴设计。

7. 实验可信度判断

可信点:论文包含公开 2D fairness benchmark、公开 skin lesion benchmark 和临床 3D CT 放疗任务;报告了 subgroup-wise metrics、worst subgroup、ES metrics 和 1000 bootstrap 95% CI;有 dMoE、GDRO、Prompt-GDRO、MoE、FEBS、FairDiff 等比较;附录给出两轴消融、KL-DRO 权重解释和数据分布。

限制:第一,关键 3D radiotherapy 数据是 in-house,无法独立复现全部结论。第二,FairDRO 依赖推理时 subgroup attribute 可用且可靠;在实际 polyp 数据中,中心、设备、患者属性未必可用或标注一致。第三,HAM10000 上 FairDRO 不总是优于 GDRO / dMoE,说明方法优势依赖“组内异质性强”这一条件。第四,代码链接未提供。第五,论文关注 fairness / robustness,不是提高绝对 Dice 的通用新分割主干;如果只追求 leaderboard 平均 Dice,价值可能低于专门的 U-Net / Transformer / Mamba 结构论文。

8. 与主流医学图像分割框架的关系

与 U-Net / 3D U-Net:radiotherapy 实验直接使用 3D Residual U-Net,说明 FairDRO 可作为 U-Net 类模型的训练目标和中间层 routing 扩展。与 nnU-Net:论文未验证 nnU-Net,但从方法上可把 subgroup-conditioned experts 放到 encoder / bottleneck,并用 DRO loss 替代普通 Dice/CE 的样本聚合。与 TransUNet / Swin-UNet / UNetR:2D 实验使用 TransUNet ViT-B,说明该思路兼容 Transformer encoder。与 Mamba / VMamba / SegMamba / DAMamba:论文没有 Mamba 模块;但 dMoE + subgroup-conditioned DRO 可作为 Mamba-based segmentation 的公平性训练扩展,尤其适合多中心 3D 医学分割。与 foundation model:引用 SAM / FairSeg 背景,但 FairDRO 本身不依赖 SAM;可用于 MedSAM / SAM-Med3D 适配后的 subgroup robustness fine-tuning。

9. 对我课题的价值

对 polyp segmentation:中等。普通息肉分割数据集没有明确 race / age / institution 信息,但可以把数据集来源、内镜中心、设备类型或困难样本类别作为 subgroup,借鉴 intra-subgroup DRO 做跨数据集泛化和公平性分析。对 DAMamba 改造:方法不是主干模块,但可作为 DAMamba 在多中心 / 多数据集 polyp segmentation 上的训练目标,强调每个数据域内部 hard cases,而不是只优化平均 Dice。对 related work:很适合用于可信医学分割、fairness-aware segmentation、clinical deployment 段落。对复现实验:如果已有 subgroup metadata,FairDRO 比较值得实现;没有 metadata 时需先做 latent subgroup discovery 或按 dataset/domain 近似。

10. 阅读建议

建议精读,但阅读目的应放在公平性与鲁棒训练,不要把它当作新 backbone 论文。建议优先读 Introduction、Method、Table 3/4、Appendix A.2 和 A.5;如果近期论文只聚焦 polyp segmentation 平均精度,可略读实验部分即可。


今日推荐优先级

  1. DuetFair / FairDRO:更值得从研究视角深入读,因为它提出的 inter-subgroup + intra-subgroup 双轴框架有较强概念价值,适合写入可信医学分割、跨中心泛化、公平性和 clinical deployment 相关章节,也能启发 DAMamba 在多域数据上的训练目标设计。
  2. SplitFed-CL:更适合工程和实验设计参考,特别是 noisy label、弱标注、多中心隐私训练和 boundary-centric annotation error simulation;如果要做 polyp noisy-label robustness,它的可迁移性很强。

今日 PDF 获取情况

  • 论文 1:已附 PDF;本地文件 MEDIA:/tmp/medseg_daily_2026-05-17/2605.11060.pdf,可访问 PDF 链接:https://arxiv.org/pdf/2605.11060
  • 论文 2:已附 PDF;本地文件 MEDIA:/tmp/medseg_daily_2026-05-17/2605.10521.pdf,可访问 PDF 链接:https://arxiv.org/pdf/2605.10521

今日可执行建议

  1. 如果今天只能读一篇,先读 DuetFair 的方法和 3D radiotherapy 实验:它对如何证明模型不仅平均 Dice 高,而且对不同 subgroup / hard patients 更可靠很有启发。
  2. 如果准备做 polyp segmentation 的弱标注或 noisy-label 实验,优先复现 SplitFed-CL 的 difficulty-guided boundary deformation;这个噪声生成比随机 erosion/dilation 更像息肉边界模糊和标注分歧。
  3. 对 DAMamba / Mamba-based segmentation 后续工作,可以把两篇合并成一个实验方向:用 DAMamba 作为 backbone,再加入 SplitFed-CL 的 label correction 或 FairDRO 的 subgroup-conditioned robust loss,验证在跨数据集 polyp segmentation 上是否降低 worst-domain failure。

参考链接

  • SplitFed-CL arXiv:https://arxiv.org/abs/2605.11060
  • SplitFed-CL PDF:https://arxiv.org/pdf/2605.11060
  • DuetFair arXiv:https://arxiv.org/abs/2605.10521
  • DuetFair PDF:https://arxiv.org/pdf/2605.10521
此作者没有提供个人介绍。
最后更新于 2026-05-17