10月11日上午,中国科学院大学人工智能学院有幸邀请到了百度计算机视觉首席科学家、微软亚洲研究院计算机视觉组前首席研究员王井东老师在雁栖湖校区教一楼109教室为同学们带来科学前沿讲座——《计算机视觉中的深度学习前沿研究》。
计算机视觉领域在过去的20年内取得了飞速的发展和进步,在自动驾驶、智能制造、多媒体信息处理等领域展现了巨大的应用价值和发展前景。讲座首先对计算机视觉领域的基本问题和深度学习的发展历史进行了回顾,展现了计算机视觉在过去十余年的发展脉络。
王井东研究员从2006年之后深度学习的发展开始介绍,分析了神经网络的复兴原因,并且通过回顾Deepfusion、ICG、HRNet、Segmentation Transformer等经典工作,帮助同学们梳理深度视觉识别架构的发展脉络。王老师的介绍使同学们不仅对深度视觉识别架构如何在计算机视觉各个领域开花结果的过程有了更深的认识,也使同学们对Group DETR和BEV DETR等领域前沿工作有了初步的了解。
接着,王老师和同学们分享了HRNet、HRFormer的设计思路、和同学们深度讨论了深度分离卷积和目前Transformer架构的关系,对DWNet前沿热点工作进行了讨论和分析并展望了未来通用架构的发展。与此同时,王老师也分享了对于从事研究工作的一些看法和自己的研究经验,同学们获益匪浅。
最后,王老师分享了百度在目标检测、语义/实例分割、自监督学习等问题上的前沿工作,向同学们介绍了Conditional DETR、Group DETR、MaskFormer在目标检测和语义分割新架构的探索和以及OCRNet、CAE等工作中背景前景解耦的设计思想。讲座结束后,同学们对王老师的讲座反响热烈,积极提问。王老师对同学们在有关研究方法、领域前沿的问题和同学们进行了解答和讨论。
更多专家信息:
王井东,百度计算机视觉首席科学家,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络(HRNet)、基于有监督的区域特征融合(DRFI)的显著目标检测、以及基于近邻图的大规模最近邻搜索(NGS,SPTAG)等。他曾担任过许多人工智能会议的领域主席,如 CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他现在是IEEE TPAMI和IJCV的编委会成员,曾是IEEE TMM和IEEE TCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士 (IEEE/IAPR Fellow)、国际计算机协会杰出会员。