东西文章

纽约时报:Google翻译工具或成业界翘楚

作者:Paul Yu2010年03月09日 18:45浏览量:742评论数:0

类型:文章专栏:纽约观点标签:纽约时报 Google 在线翻译 机器翻译

Google免费在线翻译服务已能处理52种语言,每周都有数亿人次使用它来翻译网页及其它文本。在内容纷繁复杂的计算机翻译领域,“Google在线翻译的译文已达到了艺术之境界”。

原文:http://www.nytimes.com/2010/03/09/technology/09translate.html?ref=todayspaper 作者:MIGUEL HELFT 译者:于波 09translate_CA0-articleLarge

在2004年Google公司的一次会议上,一位韩国粉丝发给公司的电子邮件成了讨论的话题。Google共同创始人谢尔盖·布林(Sergey Brin)用已获公司批准的自动化翻译服务把邮件译成了英文。

邮件原文写道,Google是最令人喜欢的搜索引擎,但翻译的结果却是:“它渴望生鱼片鞋子。Google绿色洋葱头!”

当时布林表示,Google应该能做得更好。于是6年后的今天,Google免费在线翻译服务已能处理52种语言,为同类系统之最,每周都有数亿人次使用它来翻译网页及其它文本。

卡内基梅隆大学语言科技研究院副研究员阿隆·拉维(Alon Lavie)表示,在内容纷繁复杂的计算机翻译领域,“Google在线翻译的译文已达到了艺术之境界”。

除网络搜索业务外,Google还努力发展其它业务,结果是喜忧参半。其数字图书项目已深陷法律诉讼,刚刚推出的社交网络Buzz又引发人们对隐私的忧虑。这些例子说明,试图挑战商业和文化传统的Google也有失足的时候。

但Google迅速进入翻译业顶级梯队的事实提醒人们,当Google释放出它的可怕计算能力去解决复杂问题时,会取得怎样的成绩。

如果把Google所有的网络搜索数据中心加在一起,或可算是当今世界最大的计算机。Google目前正借助这些数据中心突破翻译技术的极限。比如在上个月,Google表示,公司正设法将其翻译工具和图像分析结合起来,使得人们在用手机拍照后,照片上的德文菜单能立刻被翻译成英文。

计算机图书出版商奥莱利传媒的创始人兼CEO蒂姆·奥莱利(Tim O’Reilly)表示:“Google在线翻译是证明Google战略眼光的最好例子之一。有些人对机器翻译不屑一顾。但对数据有独到见解的Google心甘情愿地做出了必要的投资,来解决该业务推出市场前的各种复杂问题。”

长期以来,创造一部翻译机器被视作是人工智能领域的最大挑战之一。数十年来,计算机科学家试图使用规则导向性方法,即教会电脑识别两种语言的语法和词汇。

但在上世纪90年代中期,研究人员开始倾向于一种所谓的统计方法。他们发现,如果将大量的文章及手工译文输入电脑,那么电脑可以在翻译新文本时作出正确的猜测。

这种需要海量数据和超强计算能力的技术正是Google的拿手好戏。

Google工程部副总裁维克·刚铎(Vic Gundotra)表示:“我们的基础设施非常适合干这个。我们采取的方法是其他人甚至做梦都没有想到的。”

自动化翻译系统还远不完善,甚至是Google的在线翻译服务也不可能很快就抢了翻译人员的饭碗。专家表示,对于计算机而言,将句子拆分后翻译并重组的工作极为困难。

但Google在线翻译足以传达出新闻文章的基本要素,为数百万人提供了快速的翻译服务。马里兰大学帕克学院语言学副教授、机器翻译专家菲利普·雷斯尼克(Philip Resnik)表示:“如果你需要粗略但快捷的翻译服务,那么Google在线翻译就是你的选择。”

和该领域的竞争对手一样(尤其是微软和IBM),Google也将联合国文件(6种语言译本)和欧洲议会文件(23种语言译本)输入了自己的翻译引擎,以便使翻译体统能够识别这些最通用的语言。

除此之外,Google还通过网络、图书扫描项目和其它途径搜集各种文本。为了对付晦涩难懂的语言,Google发布了“翻译工具箱”,帮助用户进行翻译,然后将这些文本添加到数据库中。

Google在线翻译可能会影响到IBM等公司的企业翻译软件的销量,但自动化翻译绝不可能带来巨大收益,至少按照Google广告业务的标准来看确是如此。然而通过某些途径, Google的付出也能获得回报。

由于Google广告遍及网络,令上网更加便捷的任何东西都能使公司受益。此外,在线翻译系统还能带来有趣的新应用:Google在上周表示,公司将使用语音识别技术,为YouTube英语视频生成字幕,并将之翻译成50种语言。

领导Google机器翻译团队的公司首席科学家弗朗茨·奥契(Franz Och)表示:“这种技术能消除语言障碍,使人与人之间的交流畅通无阻。”

曾在南加州大学工作过的德国籍科学家奥契表示,他起初不愿加入Google,担心公司将机器翻译当作编外项目。Google共同创始人拉里·佩奇(Larry Page)打来电话,消除了他的疑虑。

奥契回忆说:“他的大意是说机器翻译对公司非常重要。”奥契在2004年加入Google,而佩奇的承诺不久就遭遇到了挑战。

许多翻译系统的语言模型包含多达10亿个单词,但比起Google的系统来仍相形见拙:几千亿个英语单词。奥契说道:“单词量越大,模型就越好。”

Google的付出取得了回报。2005年,美国政府对多个尖端翻译系统进行了测试,Google脱颖而出。

Google也是使用类似的方法,借助超强计算能力、海量数据和统计数字来解决复杂问题。比如在2007年,Google推出了翻译口头查询的800-GOOG-411免费目录辅助服务,这使得Google得以收集到数百万人的语音,从而令它的翻译系统在识别英语口语方面更胜一筹。

一年后,Google又发布了语音搜索系统,与其他公司花费数年时间才建立起来的类似系统相比也毫不逊色。

2009年未,Google引入了名为Goggles的手机图片分析服务,可将这些图片与数据库中的10亿多张网络图像进行匹配,其中包括来自Google街道视图功能的街道图像。

奥契承认Google的翻译系统仍不完善,但他表示该系统正迅速变得越来越出色。他说道:“目前的质量改善曲线仍然笔直向上。” 
知道吗?您可以      来发表评论,结交朋友,……