【编者按】12月23日,亿欧的第二届创新者年会上的速记录入使用了讯飞听见,作为一个外场的工作人员,在为数不多进入内场的时候听到最多的就是对机器翻译的惊叹、好奇以及隐隐的遗憾——在精准度方面机器翻译还不足够完全让人满意。瑕不掩瑜,机器翻译这一市场有众多公司都在布局,如谷歌、微软、百度、搜狗等,然而,这样一个市场,仅只是大公司的小生意么?
与以往领域不相同,AI(人工智能)技术应用的竞赛更加国际化,近期各方势力在机器翻译领域频繁发声,宣称技术优势。谷歌、微软相继宣布新一代翻译工具技术提升,百度、搜狗、科大讯飞也急忙秀肌肉,这场AI的落地竞赛逐渐烧向国际市场。
机器翻译已经有70年的发展历史,但直到近两年,神经网络机器翻译(Neural Machine Translation,NMT)技术异军突起才将翻译应用进一步革新。同时,语言处理、语音交互等技术的进步又加速了翻译产品的场景升级。正处于AI落地大战的科技公司摩拳擦掌,更不会放过翻译这一易于实现应用的领域。
谷歌日前宣布旗下神经网络机器翻译系统(GNMT:谷歌Neural Machine Translation),正式被应用到谷歌翻译中,英语和法语、英语和西班牙语的互译质量已超越了90%,中英互译准确率也在80%左右。微软日前也发布了最新一代翻译工具(Microsoft Translator),能轻松实现包括中文在内的9种语言实时语音转为文本翻译。
不出几日,对标谷歌与微软的翻译工具,百度举办了百度机器翻译技术开放日。百度技术委员会联席主席、自然语言处理部技术负责人吴华表示,基于领先的人工智能、神经网络以及自然语言处理技术,百度早在一年多前就率先发布了世界上首个互联网NMT系统。同时宣称,百度翻译支持全球28种语言互译、756个翻译方向,每日响应过亿次的翻译请求。
不只是百度,走在语音交互前列的国内企业科大讯飞日前推出了讯飞听见升级版产品,加入多语种翻译功能,可实现五种语言同步翻译成汉语,还发布了智能翻译产品“晓译翻译机”。不久前,搜狗公司CEO王小川也在演讲中展示了搜狗语音实时翻译SNMT(Sogou Neural Machine Translation)的成果。
智能语音识别是谷歌、微软、百度、搜狗等科技公司深耕的重要人工智能技术,语音识别将成为人机交互的重要方式。从应用上看语音识别更容易为智能终端带来方便快捷的服务,在语音输入、语音导航等方面均已有不少尝试,但如今结合机器翻译却并不容易满足复杂的需求。
谷歌此前宣布,使用了神经机器翻译系统网络和移动版的谷歌翻译能让翻译系统不再像以前一样逐字逐句的翻译,而是根据整篇文章的大意来对句子做多元化的分析,翻译错误可减少60%以上。在近期人工评测中,搜狗机器翻译在演讲、旅游、闲聊、日常口语等领域,采用5分制人工评分能达到4.4分,已能开始实用化。搜狗语音交互中心技术负责人陈伟透露,机器翻译准确率达90%。不过,吴华透露,百度翻译现在的准确率只能达到70分左右,离90分的准确率还有很远的距离。
北京商报记者下载最新版本的百度翻译、讯飞输入法、搜狗输入法、微软翻译、谷歌翻译进行语音识别以及汉英互译测试发现,“你好漂亮”,“我在哪儿”等简单的语音能够被快速且比较准确地识别,但是,当说出“全球首款多语种实时翻译系统来自什么地方?”来测试时,百度、讯飞识别速度较快,搜狗、谷歌略慢,微软识别并不准确。在翻译方面,简单语句都能够获得比较准确的结果,但是,对于“全球首款多语种实时翻译系统来自什么地方?”这句话,百度、谷歌与微软给出的对应英文翻译是“The worlds First Multilingual real-time translation system(comes)from where?”明显不符合英文语序,讯飞输入法的随声译则直接给出“Where does the worlds first multi-language translation system come from?”的结果,虽然语序正确但漏掉了“实时”这一词。各个输入法与翻译器对英文的识别都十分准确迅速,但在英译汉方面,百度、讯飞、谷歌都能将上述句子英文对译成准确的中文,但是微软却并未做到。而拍摄实物直接翻译这一点,可提供类似应用的不足之处更多。这也说明,机器翻译的准确度仍有提高的空间。
在人工智能爆发的当下,机器翻译领域的竞争国内企业并不落后。谈到谷歌翻译与百度翻译的对比,吴华认为,谷歌翻译在基于统计的机器翻译上做得很好,处于领头羊,但是在基于神经网络的机器翻译上,百度走在了前面。并且,谷歌翻译是以英语为中心的,百度翻译的中心是中文。另外,在语音的翻译上,百度也要领先一些。
语音实时翻译技术的成果,也反映了这一些企业在AI领域的较量正在升级。虽然不少业内人士认为人工智能当前被过度“概念化”,对真正的技术应用质疑颇多。但百度深度学习实验室(IDL)主任林元庆曾对北京商报记者表示,技术的进步与应用是离不开的,一定要通过市场的屡次检验才能促进技术的有效提高。
目前,机器翻译的应用场景已经逐渐被扩展到所有的领域中去。在to C方面,为人熟识的跨国旅游、文档翻译、国际会议等都可提供帮助。另外,在to B方面,科大讯飞将语音翻译技术推广到法院等行业领域,而百度翻译还开放了API接口,目前已有超过2万个第三方应用接入,这中间还包括华为、OPPO、中兴、三星等手机生产厂商,金山词霸、灵格斯词霸、敦煌网等企业,世界知识产权组织(WIPO)也将百度翻译API集成到官网。