不同语言间的障碍能否被打破?“当然。”这就是Google的回答。在德国计算机博士Franz Josef Och的带领下,Google正在创造全球性翻译工具的道路上前行,微软和Facebook也加入了竞争......
当科幻小说家们预想着人类的未来,许多改进世界的点子纷纷冒了出来,这些点子包括免费且无限的能源、以光速旅行的宇宙飞船,也包括创造出微型计算机用于全球语言翻译,消除语言障碍。最后那个梦想,至少Google试图让其成真。负责这个项目的计算机科学家来自德国西南部城市Erlangen附近的小山村。
现年41岁的Franz Josef Och 长久以来致力于一个目标,那就是创造出完美的翻译计算机,这台计算机是如此的不显眼和快速,“你几乎注意不到它,除非它在你耳朵边低语”,这台设备能够瞬间将任何网页或是谈话内容翻译成另外一种语言。
对Franz Josef Och来说,除了让旅行者享受无障碍的出行(也会让许多翻译者面临严峻的未来),翻译程序事实上意味着更多,那就是:通向人工智能的路径。甚至早在在青少年时期,Franz Josef Och就梦想着创造出能模拟人类独有特征的机器。
Franz Josef Och 学了计算机专业最后获得博士学位,其论文是关于人工智能的。后来因为参与DARPA(美国国防部高级研究计划局)的机器翻译竞赛,他来到了美国加州。2004年,Franz Josef Och接到Google联合创始人Larry Page的电话:把你的研究成果做大如何?于是,Franz Josef Och获得了他自己的部门——Google Translate(谷歌翻译)。
从无人驾驶汽车到延长人类寿命的实验,对未来的奇思妙想也是这个互联网巨头商业模式的一部分。尽管Google Translate目前为止只做成了一点点,但估计没有人比Franz Josef Och及其团队的野心更大了:彻底终结人类语言互不相通的历史! 一项免费的服务这位德国计算机科学家和他的团队已经实现了实质性的进展。Google Translate已经能够在71种语言之间互相翻译,不管是从英语翻译成德语还是从冰岛语翻译成日语。
举例来说,现在有德国《明镜周刊》的一篇文章,通过Google Translate,用户一转眼就能获得一个法语翻译版。只要点击按钮,意大利语网页就能显示成德语的。只需用智能手机拍下日本火车站令人费解的标识,这款翻译App就能自动识别图像上的文字并且翻译出来。
这款Google服务去年的使用量大概是2亿次。并且,到目前为止,这项服务还是免费的。但是,尤其是跨国公司,会从自动翻译服务上获得大量价值;在未来,Google也毫无疑问会因该工具而获得一笔可观的收益。
但目前Google的目标还是继续完善这项服务,借道智能手机也是该服务日臻完善的途径之一。Google Translate团队已经开发了一款App让智能手机变成一台会说话的翻译机,到目前为止能够处理二十几种语言。
只要句子相对简单,这款App都能表现出色。举例来说,有人在北京要告诉出租车司机他急着要去药店,他只要对着智能手机说,比如说德语,手机就能迅速用中文重复这句话,准确但是多少带有些机器般的声调说:“请带我去一家药店。”
Franz Josef Och 觉得这款应用仍旧“有点慢和别扭,因为你必须去按动按钮。”翻译的质量也不一致。但是,放在几年前,如果他预测Google Translate今天可以做到这些,人们一定会觉得他疯了。 巨大的突破IBM在几十年前为自动翻译奠定了基础,但是这个项目毫无进展,很快就被放弃了。基于这个原因,在Google的最初几年对Franz Josef Och来说就是和一小撮同事进行的“一个纯研究项目”。但是,最近,他们已经实现了很大的进展——按Franz Josef Och 的说话,这是“巨大的突破”。
已经得到快速成长的Google Translate团队工作地点位于Google在硅谷的主园区,这个拥有数名德国计算机科学家的团队竟没有一名纯粹的语言学家。Franz Josef Och自己也绝对不是一名有天赋的语言学家。他反而说,“我学语言方面很有困难,那也正是机器翻译的美妙之处:最重要的事是擅长数学和统计学,会编程序。”
开发词典、定义语法结构、制定通常情况下翻译程序所需的所有规则,以模拟人工翻译,所有这些都不是Google Translate团队所关注的。事实上,过于灵活的规则经常超出计算机可处理的范围。比如说,在英语和德语中,形容词放在名词前面,而在法语中却通常是反过来的。结果,翻译程序很快就不知道怎么翻了。
相反,Google发挥了它最擅长的:海量的数据和统计信息。“所以说,这个系统做的基本上就是关联现有的译文,并或多或少地自行学习如何处理数十亿文本,” Franz Josef Och说。“最后,我们开始计算翻译的可能性”。
现有数据的量越大,系统就运作的越好。这就是翻译计算机只有在互联网条件下才有可能行得通的原因所在。全球网页提供了海量的现成译文。 尚不完美Google Translate的算法能在凌乱的数据中搜索,并在过程中学习。举例来说,当程序要将一个句子从法语翻译成德语,它就搜索出已有的匹配的短语,然后计算出基于这些信息如何以最佳形式组成一个新的句子。
通常情况下,它翻译的算不错,但还远达不到完美。句法、语调和歧义性仍旧是自动翻译程序的显著问题。通常,它们完成的翻译可以读懂,但对语言学家来说则是一个噩梦。机器翻译实在毫无美感。
那么,Google是否要让程序富有创造性才称得上是真的成功了呢?Franz Josef Och的回答是否定的,他指出真正的问题是“更有效的学习”。换言之,计算机需要掌握的是模仿的艺术。
从翻译软件的角度而言,当不同种语言在语法和单词结构上相似并且有很多数据的时候,出来的翻译通常会更好。英语和西班牙语的互译尤其好,而英语和日语的互译却不如人意。“另外,不幸的是,英语和德语的互译可以归为最难的语言互译之一。” Franz Josef Och说,“这实在让我苦恼。”
Google打算如何规划Google Translate呢?Google 是想要在人类沟通方面占据垄断地位,并在全球互动方面实现自己的霸权吗? 一丝人性化对此问题,Franz Josef Och 也感到迷茫,他说商业的事情不是他的工作,但是他很愿意对此表达更多看法:“机器翻译让很多人有机会获取大量的信息,这也让其他一些事情成为可能。”他解释说,间接利益才是重点。Google已经在它的其他产品上采用了类似的方法。它的搜索引擎和电邮服务现在是免费使用的。但是,它们为Google提供了数以亿计的用户和数据。
与此同时,竞争也与日俱增。几周之前,Facebook收购了语音识别和机器翻译创业公司Mobile Technologies,这家小公司开发了一款语言输入和自动翻译系统,而Facebook想要利用这个系统实现来自超过200多个国家的超过10亿的用户间的交流。