Diff2I2P: Differentiable Image-to-Point Cloud Registration with Diffusion Prior
作者:Juncheng Mu, Chengwei Ren,Weixiang Zhang, Liang Pan,Xiao-Ping Zhang,Yue Gao
单位:Tsinghua University, Shanghai AI Laboratory
会议:2025 ICCV
链接: https://github.com/mujc2021/Diff2I2P
研究动机
1.当前的Image-to-Point Cloud的方法主要依靠度量学习来强制对齐图像和点云的特征空间,而忽略了两个模态之间存在的模态差距
2.非对齐的图像-深度会导致预训练扩散模型的预测能力下降,产生严重的生成伪影

3.梯度无法反向传播至骨干网络
核心方法

1.可微标定
利用KPConv和ResNet分别提取特征,然后采用多尺度块匹配策略来缓解尺度不匹配问题。在选取相似度最高的前 K 个点-像素对之后,得到初始的对应点
可变性对应点调整:对于每一对初始的对应点,在gt的转换下,DCT都预测一个点偏移来对齐对应点:
采用BPnP作为可微求解器
2.控制侧分数蒸馏

将点云转换到图像的平面并投影为深度图,然后用可微的致密化操作将稀疏的深度图致密化
3.损失函数
偏移损失:
度量学习损失:
总损失:
数据集
7-Scenes,RGB-D Scenes v2
算力
4张3090
实验结果





优势与不足
优势
1.实现了完全可微的训练管线
2.通过DCT以及CSD策略,显著提高了配准的精度
不足
1.训练时需要利用ControlNet进行推理,这显著提高了训练成本
2.依旧是多阶段的coarse to fine的配准流程,需要显式地构建对应点
记忆点
1.CSD方法
2.DCT偏移修正
3.可微的BPnP算法






