Google翻译

来自Local Chinese Wikipedia
(重定向自Google Translate
跳转到导航 跳转到搜索

Template:Expand English 脚本错误:没有“Message box”这个模块。 Template:NoteTA Template:Infobox Website 谷歌翻译Template:Langx)是Google开发的机器翻译服务。其运用神经机器翻译方法翻译文字、网页、或文件,服务型式除网络手机程式以外,还提供API供开发者使用。[1]截至2026年4月,谷歌翻译支援250种语言。其每月有约十亿位使用者,并处理超过一兆笔字词。[2][3]服务提供即时翻译功能(即时输入即时翻译),使用者可以在左边的输入栏位输入文字,翻译结果会即时在右边的结果框显示。将鼠标移到翻译结果文字上可以看到其对应的原文。此外,Google翻译亦提供朗读功能(包括原文和译文),使用者亦可查看中文拼音日文罗马字、及韩文罗马字等。使用较广泛的语言都有“朗读”功能,对多中心语言而言,朗读采用的口音取决于所在地区。

谷歌翻译在2006年4月28日上线,[4]起初原理为统计机器翻译:在翻译过程中,服务会在数百万份文件中寻找模式,以选定要用哪些字词、并用于目标语言中。翻译方法通常是间接翻译:当被翻译文字并非英文——如法文翻译至德文——时,通常会先把原始语言翻译为英文,再将该“英文”翻为目标语言。部分语言则会在两个语言间直接翻译,这包括加泰罗尼亚语西班牙语捷克语斯洛伐克语韩语日语等。[5][6]语言数据则来自联合国欧洲议会的文件抄本。

2016年11月,Google宣布谷歌翻译将使用神经机器翻译引擎:Google神经机器翻译系统(Google Neural Machine Translation,GNMT):该引擎将一次翻译整个句子、利用上下文来找寻最相关的翻译并加以排列,令其“更接近人类使用正确的语法表达”。[7]谷歌翻译的准确率评价不一,不同语言的翻译结果也有所差异。[8][9]

方法[编辑]

Google翻译最初采用的翻译方法称作“统计机器翻译”,具体而言,采用的是基于Template:Le参加2003年美国国防部高级研究项目局(DARPA)的机器速度翻译竞赛时获奖的研究成果。欧赫现在领衔Google机器翻译小组。

根据欧赫的说法[10],若想要开发一个可用于翻译一对全新语言对的统计机器翻译系统,必须做好如下的数据基础搜集才能有保障:一个拥有百万的单字数量级别的双语文本语料库(或者其平行库集合),以及属于这两种语言的单语语料库,各自得拥有十亿以上的单字。然后,用于翻译这一对语言的机器翻译结果就会通过这些数据产生的统计模型而得出。

为了获取这种海量容量的语言学资料,Google采用了联合国文档作为语料库内容来源。[11]由于同样的一份联合国文档通常会有属于六种联合国官方语言的译本,因此,Google如今就拥有了一个相当于经人工翻译了两百万单字的七种语言的语料库。

而这一点很可能就是Google翻译之所以一开始专注的是开发英语阿拉伯语中文之间的翻译系统,而非英语和日语或英语和德语这两对语言之间的翻译系统的原因。因为阿拉伯语和中文属于联合国六种官方语言,而日语、德语不是。

翻译语言[编辑]

谷歌翻译可以翻译多种形式的文本和媒体,包括文本、语音以及静态或动态图像中的文本。其大部分功能,谷歌翻译提供发音、词典和听翻译。此外,谷歌翻译还推出了自己的翻译应用程序,因此可以在离线模式下使用手机进行翻译。[12][13][14]

目前Google支持翻译249种语言。(按开始提供的时间顺序排列)

2008年5月以前[编辑]

页面Template:Div col/styles.css没有内容。

2008年9月25日开始[编辑]

页面Template:Div col/styles.css没有内容。

2009年1月30日开始[编辑]

页面Template:Div col/styles.css没有内容。

2009年6月19日开始[编辑]

页面Template:Div col/styles.css没有内容。

2009年8月25日开始[编辑]

页面Template:Div col/styles.css没有内容。

2010年1月25日开始[编辑]

页面Template:Div col/styles.css没有内容。

2010年5月13日开始[15][编辑]

页面Template:Div col/styles.css没有内容。

2010年9月25日开始[编辑]

页面Template:Div col/styles.css没有内容。

2011年6月21日开始[17][编辑]

页面Template:Div col/styles.css没有内容。

2012年2月22日开始[编辑]

页面Template:Div col/styles.css没有内容。

2012年9月开始[编辑]

页面Template:Div col/styles.css没有内容。

2013年4月开始[编辑]

页面Template:Div col/styles.css没有内容。

2013年5月开始[编辑]

页面Template:Div col/styles.css没有内容。

2013年12月开始[编辑]

页面Template:Div col/styles.css没有内容。

2014年12月开始[编辑]

页面Template:Div col/styles.css没有内容。

2016年2月开始[编辑]

页面Template:Div col/styles.css没有内容。

2020年3月开始[编辑]

页面Template:Div col/styles.css没有内容。

2022年5月开始[编辑]

页面Template:Div col/styles.css没有内容。

2024年6月开始[编辑]

页面Template:Div col/styles.css没有内容。

2024年10月开始[编辑]

页面Template:Div col/styles.css没有内容。

停止开发的语言[编辑]

  1. 卢欧-阿乔利语(Luo)(Acholi 阿乔利语)
  2. 脚本错误:没有“ilh”这个模块。(2015年11月推出,2016年2月删除)

有朗读服务的语言[编辑]

File:Google English accent map.svg
世界各地Google翻译朗读使用的英语口音页面Template:Legend/styles.css没有内容。
  英国英语(女声)
页面Template:Legend/styles.css没有内容。
  美国英语(女声)
页面Template:Legend/styles.css没有内容。
  大洋洲口音(女声)
页面Template:Legend/styles.css没有内容。
  印度口音 (女声)
页面Template:Legend/styles.css没有内容。
  无Google翻译服务

机械朗读[编辑]

人声朗读[编辑]

女声

页面Template:Div col/styles.css没有内容。

男声

[20]

功能[编辑]

日文维基百科的部分截图资讯:欢迎来到 维基百科 维基百科是 一个任何人都可以编辑的自由百科全书。1,503,631篇文章供 您阅读 为非日语使用者提供协助……精选文章……市川雷藏八世( 1931年8月29日- 1969年7月17日)是日本歌舞伎演员和电影演员。他的原名是龟崎明夫。后来他改名为竹内义雄,之后改名为太田义哉。六个月大时,他被第三代市川九段寺收养。十五岁时,他以市川炎藏之名在歌舞伎舞台上首次亮相。 1951年,他被第三代市川寿海收养,继承了第八代市川来藏之名。1954年,他开始涉足电影表演。1959年,他在电影《炎上》中的表演广受好评,荣获包括电影旬报奖最佳男主角奖和蓝丝带奖最佳男主角奖在内的多项殊荣。六十年代,他与胜新太郎并肩成为大映公司的两大当家花旦。 1968年6月,他被诊断出患有直肠癌,并接受了手术切除,但癌细胞转移到了肝脏,于同年7月去世。……
透过Google翻译将日文维基百科翻译至中文的截图

浏览器[编辑]

划取翻译功能是现代浏览器的重要基础功能,翻译的集成意味着打破文化壁垒,Opera和Firefox的翻译插件亦是利用谷歌翻译API作为扩展程序的核心外部接口。不过当下许多浏览器厂商,在浏览器大战背景下,出于激烈竞争,已经做出了一站式服务,例如Windows 10中自带的Microsoft Edge,微软专门为此定制了浏览器插件版的微软必应翻译。

2010年2月,谷歌翻译默认整合到Google Chrome浏览器中,用于可选的自动网页翻译。[21][22]

移动应用程序[编辑]

适用于Android和iOS的Google翻译应用程序支援249种语言,能在“对话模式”下透过照片提供37种语言的翻译。[23][24]Android 版应用程序于 2010年1月发布,iOS版应用程序则于2011年2月8日发布。[25]

字典软件[编辑]

开发者可以利用谷歌提供的API,对软件集成联网翻译功能。这些软件通常是通过集成翻译功能,实现对原有用途的用户需求满足,所完善而来。例如阅读软件、在线资料搜索时集成的WebJS小程序,由于信息技术的普遍应用和入口之争以及成熟度,目前已不再有着垄断地位,也就不存在增加翻译功能需要收费或是插广告,除非是态度问题,否则一般会作为硬性标准。

掌上翻译程序/电子词典[编辑]

当今智能手机和平板电脑平台上,亦有很多基于Google翻译而衍生成的翻译软件。不但在今日动则几十M的软件膨大趋势下做到了体积小巧,而且可以下载离线字典调用,甚至可以翻译屏幕上光标停按的部分。

准确率与局限性[编辑]

Google翻译亦有其自身功能局限,虽然用户可以通过其帮助来大致理解以外文书写的文章大意,但Google翻译服务因为一词多义[26][27]习语[28]而无法提供准确的译文,也不能提供可用于出版的内容,例如,它经常会不依据上下文来翻译词汇,而且会在翻译时不遵守语法规则,这是因为其机器翻译算法与传统的基于语法分析的算法不同,采用的是基于统计分析的算法。而Google翻译的质量也与语种有关,当源语言是一种欧盟语言,而目标语言是英语时,往往质量较好。2010年的分析显示,法语到英语的翻译相对准确[29],2011年和2012年的分析显示意大利语到英文的翻译同样相对准确[30]。2021年,加州大学洛杉矶分校医学中心(UCLA Health)的一项研究表明,英语翻译至西班牙语的准确率有94%,英语翻译至亚美尼亚语的准确率只有55%[31]。然而,当所翻译的文本较短时,其他规则法机器翻译(rule-based machine translation)却表现得更好,这在中文到英语的翻译中尤为明显[29]

争议[编辑]

中文政治类误译事件[编辑]

中文谷歌翻译曾多次在两岸关系中国内地与香港关系等政治类议题上出现误译,引发争议。

2006年、2007年,谷歌翻译相继出现“辱华”翻译,“I thought this was shame(我认为这是一个耻辱)”被误译为“我认为这是中国的耻辱”,“物极必反”被误译为“Taiwan independence(台湾独立)”。[32]

2012年,有网友发现“Taiwan is not a part of China(台湾不属于中国)”被误译为“台湾是中国的一部分”。若将句中的台湾换成其他国家,误译同样成立。另外无论输入“Diaoyu Islands is not a part of Taiwan”或“Diaoyu Islands is not a part of Taiwan”,均会出现“钓鱼岛属于台湾”。[33]

2018年,谷歌翻译在“A比B厉害”这一类句子的翻译上出现错误,“中国比台湾厉害”被翻译成“China is worse than Taiwan”,即“中国比台湾差”[34][35]

2019年香港反对逃犯条例修订草案运动期间,网友发现“so sad to see Hong Kong became China(很难过看到香港变成中国)”被误翻译为“很高兴看到香港变成中国”。网友猜测有组织对谷歌翻译进行攻击,从而影响翻译结果。[36]

2020年,台湾网友指谷歌翻译即使在选择繁体中文的情况下,仍会出现较多中国大陆习惯用语,如“President Tsai Ing Wen(蔡英文总统)”竟被翻译成“蔡英文主席”。同样的错误在微软翻译中也有发生。有台湾网友担忧台湾习惯用语会因翻译软件流行而被中国大陆习惯用语取代。[37]

2021年1月,有网友发现“China breaks promise(拉)”被误译为“中国信守承诺”。但将中国替换成其他国家后并不会出现错误翻译。[38]

2021年11月26日,有中国大陆网友发现,在谷歌翻译的英文翻中文程序中,在英文对话框输入“艾滋病毒”等相关词汇,对应的中文翻译就会出现恶毒攻击中国的词汇[39]。该消息经部分媒体及安徽团省委的微博发布后,一度登上微博热搜,并导致大批中国大陆网友在评论区表示抗议,称该事件为“人为导致”,也有网友在验证后发现部分结果还出现攻击美国、俄罗斯等国的词语。同日晚间,Google官方微博@Google黑板报先是在北京时间22:03发布微博,表示“我们已经了解到Google翻译出现的问题并正在解决。”随后在23:14分,Google在微博上表示问题已经解决,并称“Google翻译是一个自动翻译器,通过数百万已有翻译的模式为用户找到最佳翻译,然而有些模式会导致错误的翻译。”[40]而有网友在验证后表示,该事件疑似为有预谋及通过机械学习等行为操纵的行为,所谓“辱华”流程的验证逻辑与用户的正常使用习惯不同,该次事件与2009年谷歌涉黄事件之中出现“儿子母亲不正当关系”等“涉黄”联想词的行为类似[41]

俄文误译事件[编辑]

2022年4月9日,据多家俄罗斯媒体报道,在谷歌翻译的英文翻俄文程序中,在英文对话框中输入词组“亲爱的俄罗斯人(dear russians)”后,程序会建议将该词组替换成“死去的俄罗斯人”,并且在翻译后的俄文对话框中该词组中的形容词“亲爱的”会被替换成“死去的”,但是在翻译该词组中带有其他国家的名称时,则没有出现上述错误。[42]目前Google已纠正该错误。

于中国大陆之现状[编辑]

2014年5月31日起,Google所有服务(各个IP段)在中国被大规模干扰至今[43],但因为翻译及地图网页版服务有域名后缀为.cn的入口,并且使用了专门设立在中国境内的服务器和IP地址,所以翻译及地图网页版仍然能正常服务。

2017年3月29日起,中国大陆用户可以直接使用Google翻译而不需要使用代理。在此之前,翻译需使用代理而无法直接翻译,但下载离线翻译包后可使用离线翻译进行翻译。[44][45]

2021年9月初,大量用户表示谷歌翻译app在不使用代理的情况下仅可使用转录,但网页版还能正常使用。[来源请求]

2022年9月26日,谷歌中国搜索页面到Google翻译的链接被移除[46]。9月29日,Google将位于.cn域名的Google翻译网站关闭,只留下一个到.hk域名的跳转页面,并像搜索页面一样标记“请收藏我们的网址”[47][48],这意味着Google翻译服务已不在谷歌中国的网站上提供。9月30日,一名Google发言人告诉TechCrunch关闭该服务的原因是“使用率低”[49][50]。这一变化影响了中国用户的文档查看器KOReader等应用程序的翻译功能,以及Chrome的内置翻译功能[50][51][52]

彩蛋[编辑]

Google翻译曾经内置有一个小彩蛋,在输入特定文字后让程序朗读,可以输出Beatbox的效果。[53]目前该彩蛋已经移除。

参见[编辑]

参考资料[编辑]

外部链接[编辑]

Template:NavboxV2

脚本错误:没有“Authority control”这个模块。脚本错误:没有“Check for unknown parameters”这个模块。