9月27日上午,中国科学院大学人工智能学院有幸邀请到了北京大学信息科学技术学院教授、国家杰出青年科学基金获得者查红彬老师在雁栖湖校区教一楼109教室为同学们带来科学前沿讲座——《三维视觉信息处理:基于在线学习的SLAM》。
随着传感技术、高性能计算设施等信息技术的进步,人类获得万千世界的三维视觉信息的方式越来越便捷。三维视觉和SLAM技术不断推动着机器人科学、自动驾驶、智慧城市等领域的进步。讲座首先介绍了三维视觉领域和SLAM技术的发展历程以及当前三维视觉和SLAM领域的关键问题,展现了三维视觉和SLAM技术如何深刻地与模式识别与智能信息处理技术相互促进相互影响。
查老师从机器人抓取杯子,物体遮挡等基本现象和生物的双目视觉系统开始介绍,从多个角度向同学们介绍三维视觉技术在智能交互和模式识别领域的重要性。随后,查红斌老师向着同学们综述了三维视觉领域的基础理论以及三维重建、三维目标检测与追踪、三维结构与行为分析等重要的研究课题。与此同时,查老师也介绍了三维视觉的发展历程,深入浅出了介绍了三维视觉如何从病态计算问题发展到Marr视觉理论再到当下的三维视觉表示和多视点几何理论。查老师的讲解凝练的总结了三维视觉领域中三维数据获取、大规模场景的三维表示等关键问题,给了同学们很好的启发。
接着,查老师向同学们介绍了SLAM技术。查老师从SLAM技术的关键问题入手,介绍了SLAM技术的建图和定位两个关键环节。介绍了SLAM技术的发展历程和目前的SLAM技术误差积累和计算量过载挑战问题。从利用图像的结构信息和语义信息等角度。之后,查老师比较了离线学习和在线学习两种深度学习方法并讨论了在线学习在处理SLAM传感器流数据的应用。
最后,查老师向同学们分享了目前SLAM技术的一部分前沿动态工作。通过介绍MOE实验室的一项工作,展示了基于GAN的自监督学习在SLAM中时空关系建模和降低误差积累问题的应用。在讲座最后,查老师对三维视觉和SLAM技术的未来进行了展望,讨论了增量学习、持续学习和自监督学习领域与三维视觉领域的交叉应用。
更多专家信息:
查红彬,北京大学信息科学技术学院智能科学系教授,机器感知与智能教育部重点实验室主任,主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、三维物体识别等方面取得了一系列成果。出版学术期刊和国际会议论文300多篇,其中包括IEEE T-PAMI、IEEE T-VCG、IEEE T-RA、IEEE T-SMC、ACM T-IST、JMLR、PR等国际期刊以及ICCV、ECCV、CVPR、CHI、ICML、AAAI、ICRA等国际学术会议论文100余篇。