中国AI军团称霸全球口语翻译大赛!搜狗夺冠,科大讯飞阿里二三
Translation)国际顶级口语机器翻译评测大赛上,中国公司搜狗,一举夺魁。这也是搜狗WMT2017机器翻译顶级评测大赛夺冠后,拿下的又一项机器翻译领域的技术冠军。而且值得注意的是,这一次还是主流口语翻译领域的冠军,搜狗技术进展之快。也算是对搜狗口语机器翻译实力的展示和奖励吧~现在,IWSLT比赛夺魁,不仅是搜狗AI硬实力的展示,也是中国AI实力在国际竞技场中的输出。...
中国AI,再次称霸全球机器翻译竞争。
在刚刚结束的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测比赛中,中国公司搜狗获得一等奖。
在同一领域竞争中,也有科大讯飞、阿里巴巴、APPTEK(美国应用技术公司)、AFRL(美国空军研究实验室)、KIT(德国卡尔斯鲁厄理工学院)等众多国内外大师。
△IWSLT官宣结果
这是搜狗继赢得WMT2017顶级机器翻译评测大赛后,又一次在机器翻译领域获得技术冠军。
而且值得注意的是全国英语口语大赛题目,这次依然是主流口语翻译领域的冠军,搜狗的技术进步很快。
口语《华山论剑》机器翻译
IWSLT,全称:International Workshop on Spoken Language Translation,是全球最具影响力的口语机器翻译评测大赛。
自2004年至今已经举办了15年,每届比赛都吸引了来自世界各地机器翻译领域的知名企业和研究机构的参与,也是“剑上的华山”在口语机器翻译领域。
在本次比赛中,爱尔兰ADAPT中心、美国约翰霍普金斯大学、德国卡尔斯鲁厄理工学院、芬兰赫尔辛基大学、英国爱丁堡大学、美国AppTek等国际领先,而阿里巴巴被吸引了。 、科大讯飞等中国主要厂商。
具体是今年IWSLT 2018的口语机器翻译任务,主要是基于指定数据集评估英语到德语的语音翻译能力。
因此,对于专注于中英翻译场景的中国企业来说,技术实力更受考验。
2个主要赛道的比赛
本次比赛分为两大赛道:
首先是Baseline Model(基线模型跟踪),主要评估语音翻译的管道方案。输入的语音首先经过语音识别系统得到语音识别结果,然后将结果发送到机器翻译系统得到翻译。
这也是业内最主流、最有效的语音翻译解决方案。市面上几乎所有的语音翻译产品,比如商用机器的同声传译和翻译机,都使用了类似的方法。
另外一个track是End-to-End(端到端的track),是本次试用的新track。主要鼓励参与者探索基于神经网络的端到端语音翻译解决方案。希望能直接基于深度神经网络模型输入语音输出翻译。
该方法仍处于早期研究阶段,受限于语音文本并行语料的大规模采集难度、算法研究不成熟等因素,距离商用还有很长的路要走使用。
不过,虽然两大赛道分主次,但评价结果是一样的。
我们都看BLEU——机器翻译质量的评价指标。值越大,翻译质量越好。
在本次评估中,当训练集和测试集相同时:
Baseline Model 轨道上的最佳系统实现了 2 的 BLEU8.09;
End-to-End 赛道上最好的系统只实现了 19.4 的 BLEU。
与Baseline Model track相比全国英语口语大赛题目,差异为8.69 BLEU,差异更加明显。
也证明了Baseline Model轨迹评估的算法仍然是目前最可行、最实用的方案。
搜狗夺冠
而这次搜狗夺冠,是对Baseline Model赛道的评价。
评估任务是针对TED演讲和会议学术报告。测试集包括来自英国、欧洲、印度等各个国家的英语发言者全国英语口语大赛题目全国英语口语大赛题目,存在噪音、口音、表达自由等复杂的语音现象。
同时,语言中有大量的领域专有名词和口语表达(如:大量的情态助词、不正确的语法表达等)中国AI军团称霸全球口语翻译大赛!搜狗夺冠,科大讯飞阿里二三,具有很强的实用性意义和挑战。
最终,中国军团成为了比赛的最大赢家。
搜狗第一,科大讯飞第二,阿里巴巴第三。
其中英语培训,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6 BLEU,领先排名第三的阿里巴巴5.73 BLEU。
算是对搜狗口语机器翻译能力的展示和奖励~
搜狗押注人工智能翻译
搜狗的AI翻译现在家喻户晓。
在搜狗的人工智能战略中,语言是核心。
并以“自然交互+知识计算”为AI核心方向英语培训,不断深化技术,推动技术快速向产品转化。
2016年,搜狗发布了自己的人机交互解决方案——知音引擎。
而由于真实语料库数据充足的优势,搜狗将语音识别与机器翻译技术相结合,随后在2016世界互联网大会上推出了全球首个商用AI同声传译系统——搜狗同声传译,从而带动了语音翻译技术的推广应用。
之后,通过上百场国际会议“实战”学英语,搜狗同声传译成为最火的“AI字幕大师”。
与此同时,搜狗也开始在AI智能硬件上发力,推出一系列智能硬件,将语音翻译技术应用到更广泛的场景,让更多消费者用户直观使用,并解决问题跨境交流。
2018年3月,搜狗推出搜狗旅游翻译器,具有离线翻译功能和照片翻译功能。
当时,搜狗旅行翻译作为第一款智能翻译硬件,支持42种语言的对话翻译,解决了用户在旅行场景中听不懂、听不懂、说不出来的真正痛点。
产品在京东平台上线当日即售罄,首日销量突破1000万。
在首发后,搜狗还推出了录音笔译笔,提供录音转录、对话翻译、同声传译等功能。将人工智能同声传译应用到消费产品中,开辟语音翻译新渠道。
现在,赢得IWSLT比赛,不仅是搜狗AI硬实力的展示,也是中国AI实力在国际舞台上的输出。
希望搜狗能够将最新的技术快速商业化并在场景中落地,让更多的用户享受到人工智能带来的好处。
传送门:
IWSTL 2018 比赛结果
猜你喜欢
发表评论
评论列表