招考网合作机构 > 学校机构 > 广东外语外贸大学欢迎您!

咨询热线 020-36204310

中葡英机器翻译实验室成立 首次尝试计算机"神经网络"

发布时间:2016-08-02 10:55:48

B 科技创新

首次尝试计算机“神经网络”

一边是终身为翻译事业奋斗的语言学家,一边是机器翻译科技公司,两个似乎本应是对立面的阵营为何走到了一起?

答案是,他们要共同开发机器翻译的“神经网络”。

实际上,不仅欧盟,不少新闻媒体也已“尝鲜”,引入了机器翻译。比如央视国际频道的新闻播报,屏幕上的双语字幕其实就是机器翻译完成的,而BBC推出的新闻网页翻译也是由机器完成的,在新闻直播时,翻译字幕只有几秒的延迟。

但人们对机器翻译的期望并不只局限于公文和新闻,人们希望能第一时间看到最新的外语影片,只需在线字幕翻译而不用仰仗“字幕组”;留学生们希望可以走进世界任何一个课堂,通过即时课堂同声传译就能自由学习,而不用再费时费力地先读语言预科。

“未来这些都可以实现。”合作方之一机器翻译科技公司的CEO于洋认为,目前的机器翻译在生动活泼不规范的生活语言领域之所以体验还不够好,是因为算法,只有让计算机能够像人一样思维,才能像人一样“说话”。

因此,中葡英机器翻译实验室会首次在机器翻译方面尝试使用“计算机神经网络算法”,而语言学家的加盟可以让这项技术得以完善。

什么是“神经网络”?机器翻译研究专家程国艮打了个比方:“比如人看到碗筷杯盘这类名词,即便不直接描述吃饭,也会联想到吃饭,这就是人的思维方式。而以往的计算机算法不是这样,没有这种联想,所以人们会觉得计算机与人交流时很笨。神经网络中,信息也将按照人的大脑完成记忆工作的方式来处理。”

C 语音识别

早已成熟应用却被抱怨最多

很多人应该都有过被手机语音识别气得半死的经历,在机器翻译中,语音翻译可能是比文本翻译更加被普通人急需的功能,但就目前的应用现状看,“槽点”最多的也是它。但其实,语音识别没有我们以为的那么幼弱,在一些习以为常的地方,它们已经发挥了很重要的作用,比如中高考的英语“人机对话”。

广东省从1999年开始率先增加英语听力考试,并于2004年增加了口语计算机考试,也就是通常所说的“人机对话”——考生坐在电脑前,戴上特制的耳麦,计算机开始播放听力试题,考生根据提问一一作答。计算机记录下考生的答案后,综合打分。

“如此大规模的听说考试,如果用人与人面对面的考试方式,不可能像笔试一样数十万人同时考试,根本无法完成考试任务,所以广东采用了‘人机对话’,并在2014年开发了计算机评卷系统,非常高效。”广东省教育考试院副院长黄友文告诉记者,十几年的“人机对话”搞下来,高校反馈,广东学生的英语应用能力明显提高。

为什么关系到千万学子前途的国家考试敢于用这么“不成熟”的技术?专家解释,计算机语音识别在特定领域内的确可以比人更出色,即便是主观题的答案,得分点也都在一些关键词上,很容易被机器抓取。这时,既不会有日常语言中的千变万化,也不会有背景噪音和含混不清,机器识别反而更准确和高效。

D 机器学习

大数据点燃人工智能加速引擎

如何让语音识别技术走下“规范用语”的窄轨,进入日常应用呢?除了前面说到的“神经网络”算法外,大数据时代的到来,将给语音识别乃至语音翻译插上翅膀。

“打个比方,人们常常在对话中会出现一时没听清楚的情况——你刚才说什么,请再说一遍?”程国艮给记者看了一段视频,这是一段极其简短的语言片段,说的是某种方言,在没有任何提示的情况下,反复听多次也不明白他在说什么。“这是因为人脑对语言的判断需要足够的信息元素,上下文语境等等背景可以用来帮助我们快速理解语言的意思,当抽离了很多信息元素时,就很费解了,”程国艮说,“但实验证明,在这种情况下,依托大数据的机器语言识别能力就超过了人脑,它能‘分析’出信息不够的语句背后的完整意思。”

专家们一致认为,翻译是人工智能中集大成者,随着大数据资源库的不断膨胀,机器能够学习的资源越来越多。“比如电脑手机的输入法,人们每敲击一次键盘,都是在给语言数据库以及其他各类大数据库添砖加瓦,机器就是这样学会了世界各地人们的各种语言习惯包括个性化表达。”于洋说。而要表达一个意思,熟练的翻译者可以掌握几种常用句式,但实际生活中,可能有超过100种句式,包括非常个人化的表达方式,这些就是翻译者无法掌握而计算机却可以全部学会的。

也就是说,不用担心未来的机器人说话干巴巴,它们能够说的花样可能你想破脑袋都想不出来。