人工智能学院举办 “自然语言生成及其评价”科学前沿讲座

  • 文/图 霍子欣
  • 创建时间: 2023-04-15
  • 1425

  4月14日上午,中国科学院大学人工智能学院有幸邀请到了北京大学王选计算机研究所教授、CCF-NLP专委会秘书长、自然语言生成与智能写作专委会副主任万小军老师,在雁栖湖校区教一楼207教室为同学们带来科学前沿讲座——《自然语言生成及其评价》。

095642 168035 1

  首先,万小军老师对NLG、AI写作的概念进行了一个简单介绍,引入了NLG写作的搜索空间大、质量评价困难等难点。通过介绍小柯机器人、AI小说写作等有趣的案例引入了NLG典型方法:文本拼凑、词语序列生成(主要基于seq2seq模型)等,另外还强调了文本拼凑方法的不足之处,即生成的文本可能会违背原创性、缺乏连贯性、逻辑性和可读性,同时还会存在信息重复和语言模板化的问题。

095642 322745 2

  进一步地,万小军老师介绍了基于预训练语言模型的文本生成方法,包括Left to Right LM: GPT-2、GPT-3;Encoder – Decoder: BART、T5等,这些模型利用了大规模的文本数据进行预训练,可以生成更加流畅、连贯的文本,并且可以实现一定程度上的创新性和个性化。

  接下来,万小军老师讲解了最近非常火热的预训练语言模型Chat GPT,介绍了它能力广泛、不仅仅支持文本生成任务、通过统一的接口执行不同任务、具有很强上下文理解和记忆能力、在零样本条件下多数NLP任务上的下性能表现良好、尽量生成安全符合人类价值观的回复等特点。此外,万小军老师对语言大规模的能力涌现进行了解释与讨论,强调了神经网络文本生成的问题和挑战,包括内容覆盖性问题,篇章连贯性问题、信息保真性问题、文本多样性问题、内容安全性问题等,还通过使用ChatGPT生成对北京大学校长的介绍的实际例子,说明了现在的ChatGPT模型仍存在生成内容准确性不高的问题。

  最后,万小军老师对NLG评价方法做了简要介绍,鼓励学生们积极参与到自然语言生及其评价这一领域的研究和应用中,并为未来的发展展望了美好的前景。在讲座的最后同学们纷纷表示感谢万老师的分享和鼓励,并表示将继续深入学习和研究自然语言处理,为推动这一领域的发展做出自己的贡献。

095642 786278 3

  更多专家信息:

  万小军,北京大学王选计算机研究所教授、博士生导师。研究兴趣包括自动文摘与文本生成、情感分析与语义计算、多语言与多模态NLP等。曾担任计算语言学重要国际期刊Computational Lingustics编委、国际会议EMNLP 2019程序委员会主席,现任CCF-NLP专委会秘书长、中文信息学会理事、自然语言生成与智能写作专委会副主任、TACL与ARR执行编委、 NLE编委、 JCST编委,多次担任相关领城监要国际会议(ACL. NAACL EMNLPEACL, AACL)高级领城主席或领域主席。荣获ACL2017杰出论文奖. UCAI 2018杰出论文奖.研制推出多款A写作机器人,如小明、小南、小柯等,应用于多家媒体单位。