您的位置: 未来之星>舞蹈才艺>

吴华:神经网络机器翻译技术大幅提升翻译质量

发布时间:2016-12-23 09:16:18  |  来源:新华网  |  作者:凌纪伟  |  责任编辑:伍晓敏

新华网北京12月23日电(凌纪伟)从提出到大规模应用,基于统计机器翻译(SMT)技术的互联网翻译系统花费了15年时间。而神经网络翻译(NMT)技术从2014年9月提出,到百度2015年5月上线首个神经网络机器翻译系统,只用了短短8个月时间。

12月21日,百度技术委员会联席主席、自然语言处理部技术负责人吴华博士表示,NMT这一技术带来了翻译质量的大幅跃升,极大地提升了用户体验。“百度翻译在中英的测试集上,翻译质量比之前传统的方法提升了7个百分点以上。”

众所周知,机器翻译距今已有70年的发展历史。自上世纪40年代起,基于规则、实例以及统计的机器翻译方法渐次登场,各领风骚。近两年,神经网络机器翻译技术异军突起,取得了翻译质量的大幅跃升。在2016年学术界顶级会议上,几乎全是围绕NMT相关的创新工作。今年9月,谷歌、微软等公司也相继发布NMT系统。

NMT技术缘何受到追捧?据吴华介绍,它克服了传统方法将句子分割为不同片段进行翻译的缺点,而是充分利用上下文信息,对句子进行整体的编码和解码,从而产生更为流畅的译文。

“翻译如果想做得非常准确的话,是要有一些背景知识,还有偏向知识的。”吴华举例说,比如在读文章的时候,是在通读了这篇文章后我们才能知道一句话的意思。再比如读英文文学作品时,我们可能认识每个英文单词,但如果缺乏英文文学积累或者当地文化背景,就不能深入理解作品内涵。

吴华说,这正是机器翻译下一步要去解决的问题,就是要从篇章上通读,抓住这个段落或者篇章逐字翻译,而不是像现在这样按句翻译。基于神经网络技术本身,它在长句的处理能力上比某些翻译要好一些,翻译质量有很大提升。她说,作为一款翻译工具,最核心的是翻译质量,未来几年百度会基于神经网络技术进一步扩大领先优势,提高翻译内容的准确度。

虽然神经网络翻译技术促使翻译质量大幅提升,但如果用“信达雅”的翻译原则衡量当前机器翻译的水平,吴华认为它还处在“信”的层面,或者说处在相对直译阶段。

随着百度、谷歌等科技公司陆续推出神经网络机器翻译系统,有关“翻译这个职业会被淘汰么?”的争论颇受关注。对此,吴华的观点是机器翻译在很长一段时间都达不到人工翻译的精准层次,特别是在对精度要求较高的专业翻译领域。她认为,机器翻译如果要取代人工翻译,其准确度至少要达到90%以上,而目前也就只有70%的水平。

不过,吴华指出,机器翻译也有一定的自身优势,它好像是你的一个随身翻译官一样,在对翻译质量要求不太苛刻的情况下,它能随身帮你解决生活中的一些实际问题。她以百度翻译为例说,公交车售票员用百度翻译帮助巴基斯坦小伙子找回失物、游客利用『对话翻译』、『拍照翻译』功能在国外自由沟通等等,都表明了百度翻译越来越多的融入生活。

据悉,目前百度翻译支持全球28种语言互译、756个翻译方向,每日响应过亿次的翻译请求。此外,百度翻译还开放了API接口,已有超过2万个第三方应用接入,华为、OPPO、中兴、三星等手机也接入了百度翻译API。世界知识产权组织(WIPO)也将百度翻译API集成到官网,供用户将专利信息翻译成不同语种查询。

 
分享到:
0