11月8日上午,中国科学院大学人工智能学院有幸邀请到了北京大学教授金芝,在雁栖湖校区教一楼109教室为同学们带来科学前沿讲座——《Multi-perspective representation learning for source code analytics》。
金芝老师首先展示了研究成果的实际应用,AiXcoder Demo,说明智能机器人如何辅助编程,接着介绍代码的表示学习的发展历程以及其重要意义,接着通过对深度学习模型如何学习代码的表示,以及使用深度学习方法的优势,同时解释了为什么这个对代码是可行的,以及一些需要注意的问题。
紧接着,金芝老师从两个角度为学生分析如何进行代码的表示学习,第一个角度是从语法句法的结构,第二个是从自然语言翻译的角度,分别选择了几篇代表性的作品分析代码结构语义以及代码理解,并向同学们介绍有关代码智能的研究日渐火热,在Machine Learning for Big Code and Naturalness上面有最新的进展。最后还举了几个具体的实际应用,如在代码中检测是否存在冒泡排序,以及取得的准确率;以及代码注释的效果,以及辅助API的书写。
最后,金芝老师介绍了一些其课题组所聚焦的疑难点,并分享经验,同时说明现在离真正的代码智能还有多远的路,分析近年来十分火热的预训练模型如AlphaCode,Copilot等,最后给同学们指点应该在哪几个方面进行着手研究推进代码智能。
更多专家信息:
北京大学教授,高可信软件技术教育部重点实验室常务副主任,国家杰出青年科学基金获得者,中国计算机学会会士。兼任国务院学位委员会学科评议组成员(软件工程),中国计算机学会常务理事,中国计算机学会系统软件专业委员会主任,中国人工智能学会知识工程与分布智能专委会副主任。长期从事软件工程和知识工程的研究,先后担任973项目首席科学家,国家重点研发计划专项和国家自然科学基金委重点项目等的项目负责人,曾获教育部科技进步一等奖,CCF技术发明一等奖、北京市技术发明二等奖、CCF杰出成就(夏培肃)奖、IEEE TCSVC杰出领导力奖、中创软件人才奖等。发表论文两百余篇,4次获得ACM Distinguished Paper Awards出版专著3部。任《软件学报》执行主编,《计算机学报》副主编,JCST领域编委,以及IEEE TSE、IEEE TR 、ACM TAAS、EMSE及RE等的编委。