人工智能学院举办“低资源神经机器翻译”专题讲座

  • 文/图 张宇欣
  • 创建时间: 2021-04-23
  • 3622

       随着深度学习的发展,神经机器翻译在近几年也取得了巨大的进步。对于某些资源丰富的翻译任务,比如新闻领域的中英翻译,神经机器翻译甚至达到了能与人媲美的程度。但是对于一些低资源的翻译任务,比如小语种翻译,或某些特定的领域,大规模的双语句并不是特别容易获得,从而导致翻译质量不尽如人意。为解决训练数据不足的问题,数据增强技术越来越受到重视。为了同学们能够深入了解目前机器翻译的最新研究进展和研究技术,人工智能学院特邀微软亚洲研究院刘树杰高级研究员,在4月23日10时30分,于教一101教室开展题为“低资源神经机器翻译”专题讲座。

       刘树杰,微软亚洲研究院高级研究员,2012年博士毕业于哈尔滨工业大学。2012年加入微软亚洲研究院,从事自然语言处理、语音处理以及机器学习相关工作。在自然语言处理各顶级期刊和会议上发表论文70余篇,并合著《机器翻译》一书,参与编写《人工智能导论》一书。获得国际自然语言和语音处理评测比赛多项第一。担任多个国际会议审稿人及领域主席。其研究成果被广泛应用于Microsoft Translator、Skype Translator、Microsoft IME和微软语音服务等微软重要产品中。

140433 930000 0423 01

       刘树杰研究员首先为同学们介绍了神经机器翻译近年的发展状况和基本方法,对于训练资源不丰富、模型复杂度较低的领域,他为同学们介绍了集中具体的数据增强技术,包括基于双向一致性的数据增强技术(L2R+R2L)、联合训练(S2T+T2S)的方法以及三角语言的训练框架。进一步的,他还介绍了在完全没有双语数据的情况下进行机器翻译的方法,即无监督机器翻译,包括双语词典的获取、模型的初始化,以及迭代训练和利用统计机器翻译的后验证方法。

       在讲座结束之后,同学们积极与老师进行交流,提出自己看法与疑问。通过这次讲座,每个人都受益匪浅。

140442 554460 0423 02