人工智能学院三维视觉团队3篇论文被CVPR2025接收

  • 人工智能学院
  • 创建时间: 2025-03-11
  • 619

   日前,人工智能与计算机视觉顶级学术会议CVPR公布论文接收结果。CVPR (IEEE Conference on Computer Vision and Pattern Recognition) 是计算机视觉领域的三大世界顶级会议之一。本届CVPR会议收到了13008篇有效投稿,其中2878篇被录用,最终录用率为22.1%。人工智能学院三维视觉团队3篇论文被CVPR2025接收。具体内容介绍如下。

 

   1. 保证多视角几何一致与视角依赖可见性的三维矢量图生成

   Empowering Vector Graphics with Consistently Arbitrary Viewing andView-dependent Visibility

   论文作者:李一迪,肖俊,卢政达,王逸群,姜海勇

   通讯作者:卢政达,姜海勇

   矢量图形具有易于编辑、可任意缩放的优点,基于矢量图形的应用和研究引起了人们的广泛关注,研究三维矢量图形的自动化生成为矢量图形的应用提供了新的可能。现有工作忽略了矢量图形和自然图像之间的域差异,并且在渲染过程中未考虑矢量几何基元的可见性情况,生成结果往往缺乏合理的几何特征与视角依赖的可见性。本研究旨在生成具有多视角一致和视角依赖可见的三维矢量图形。该任务具有以下挑战:由于矢量图形缺乏自然图像中丰富的语义信息,难以直接应用现有蒸馏方法直接优化三维矢量图形;无法从三维矢量图形提取连续几何表面,从而难以将现有遮挡渲染方法应用到三维矢量图形。针对上述挑战,本方法从预训练的文本-图像模型中蒸馏一个显式的三维高斯生成过程作为几何先验,从蒸馏的状态空间中逐步重新采样由粗到精的监督先验,并使用几何相似性损失约束矢量图形生成;然后,设立对极虚拟相机,结合可优化的依赖视角的几何基元重要性和对极深度投票,来判断当前视角下的几何基元可见性。考虑到矢量图形在工业设计中的重要性,研究希望启发对矢量图形的自动生成与设计进行进一步探索。

图1 多视角几何一致和视角依赖可见性的三维矢量图形生成结果

 

   2.面向三维点云分割持续测试时间适应的领域去相关

   D3CTTA: Domain-Dependent Decorrelation for Continual Test-Time Adaption of 3D LiDAR Segmentation

   论文作者:赵纪春,姜海勇,宋昊轩,肖俊,巩东

   通讯作者:姜海勇,肖俊

   在自动驾驶等场景中,3D点云语义分割面临动态环境变化带来的域偏移问题,使得模型在测试阶段难以保持鲁棒性。当前主流方法多依赖反向传播进行模型更新,计算开销较大,且往往需要较大的批数据,难以满足自动驾驶的在线适应需求。此外,现有工作多集中在2D图像上,无法有效利用3D点云的几何先验。研究认为,在点云语义分割的CTTA问题中,不同距离的点云由于密度不同,会导致分布的差异,同时,不同域点云特征的高度相关性使得不同类别的分割结果容易混淆。为了解决上述问题,D³CTTA框架由距离相关原型学习模块(DAPL)和领域相关去相关模块(DSD)组成。DAPL模块通过考虑不同点云密度对特征学习的影响,构建距离相关原型,提升特征判别能力。DSD模块则针对不同域保留并更新特定参数,并利用DAPL模块的可靠预测对特定域的特征进行去相关操作,以减轻类别间混淆并优化分割性能。作为一种无需反向传播的在线适应方法,D³CTTA在多个基准数据集上超越了现有的最先进CTTA方法。

图 2 在多次域重复的测试环境,团队提出算法鲁棒性更好

 

   3.基于稀疏几何部件激活的三维点云持续学习

   Activating Sparse Part Concepts for 3D Class Incremental Learning

   论文作者:田震亚,肖俊,刘鲁鹏,姜海勇

   通讯作者:肖俊,姜海勇

   开放世界中各种应用场景的数据和任务是动态变化的,传统的深度学习模型面临灾难性遗忘问题,即直接使用新任务来优化模型会抹去以前的旧任务的知识,导致不可逆的性能下降。研究认为,目前的持续学习方法大多是基于二维图像的,对三维数据的特性考虑的比较少,直接将这些方法应用到三维点云上容易出现捷径特征问题,导致三维分类器关注实例的某个局部特征而忽视了实例的其他部分,在新任务和旧任务具有相似局部特征的情况下,往往会混淆新任务和旧任务,加剧了灾难性遗忘的问题。本研究旨在利用共享部件帮助分类器对三维点云持续学习,使之能够减少捷径特征的出现,提高持续学习的效果。本方法首先提出了一个部件感知库来学习不同类别的各种局部几何部件原型。为了获得部件原型和实例局部特征的对应关系,本方法使用了注意力机制和top-k来选择实例中可能存在的部件原型。此外,由于不同任务的分类器之间可能会存在互相干扰,本方法提出了一个可学习的参数来调整不同任务的预测结果的相对重要性。

图3 基于部件学习的三维点云持续学习框架