谷歌翻译增加了24种语言和方言,包括梵语和Bhojpuri
谷歌增加了24种语言的谷歌翻译语言翻译工具。翻译目前覆盖了全世界使用的133种语言。
新的印度语言包括阿萨姆语、Bhojpuri语、梵语、Dogri语、Konkani语、meitilon(曼尼普尔语)、Mizo语和Maithili语。
谷歌还首次将盖丘亚语(秘鲁、玻利维亚、厄瓜多尔)、瓜拉尼语(巴拉圭、玻利维亚、巴西、阿根廷)、艾马拉语(玻利维亚、秘鲁、智利)以及以英语为基础的克里奥语(塞拉利昂)加入该服务。
5月11日,谷歌Translate用户将开始使用这些新语言,所有用户将在本周末访问这些语言。
名单上的语言还包括埃维语(加纳和汤戈语)、库尔德语(伊拉克)、塞佩迪语(南非)、特维语(加纳)、奥罗莫语(埃塞俄比亚和肯尼亚)、特桑加语(斯威士兰、南非、津巴布韦和莫桑比克)。
据该公司称,超过3亿人将这些语言作为他们的第一或第二语言。它进一步补充说,这些语言也是谷歌利用被称为零shot机器翻译的翻译添加的第一批语言,这是一种通过查看文本将任何测试翻译成另一种语言的学习模型。
24种新语言的完整列表添加到谷歌翻译
阿萨姆语(印度东北部约2500万人使用)
艾马拉语(玻利维亚、智利和秘鲁约有200万人使用)
班巴拉(马里约有1400万人使用)
Bhojpuri(印度北部、尼泊尔和斐济大约有5000万人使用)
Dhivehi(马尔代夫大约有30万人使用)
多格里语(印度北部大约300万人使用)
Ewe(在加纳和多哥大约有700万人使用)
瓜拉尼语(巴拉圭、玻利维亚、阿根廷和巴西约700万人使用)
Ilocano(菲律宾北部约有1000万人使用)
昆卡尼语(印度中部约200万人使用)
Krio(塞拉利昂约有400万人使用)
库尔德语(索拉尼语)(约800万人使用,主要在伊拉克)
在刚果**共和国、刚果共和国、中非共和国、安哥拉和南苏丹共和国,约有4500万人使用林加拉
卢甘达(乌干达和卢旺达约有2000万人使用)
Maithili(印度北部约有3400万人使用)
梅特隆(曼尼普尔)(印度东北部约有200万人使用)
Mizo(印度东北部约83万人使用)
奥罗莫语(埃塞俄比亚和肯尼亚约有3700万人使用)
盖丘亚语(在秘鲁、玻利维亚、厄瓜多尔和周边国家大约有1000万人使用)
梵语(印度大约有2万人使用)
Sepedi(南非约1400万人使用)
Tigrinya(厄立特里亚和埃塞俄比亚约有800万人使用)
特松加(在斯威士兰、莫桑比克、南非和津巴布韦大约有700万人使用)
Twi(加纳约1100万人使用)
Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)在演讲中表示:“如今,网络上有一长串语言没有得到充分代表,翻译它们是一个棘手的技术问题,因为翻译模型通常是用双语文本训练的。然而,目前并没有足够的可供每种语言公开使用的双语文本。”
由于这是一项新技术,谷歌选择将重点放在使用人数较多的语言和技术通常保留的地区,这导致了在非洲和印度的一些语言的研究工作,因为那里存在大量的语言和种族群体。
在一篇博客文章中,该公司表示,虽然该技术目前还不完美,但他们将继续开发模型,以提供与现有语言类似的体验。
看wion住在这里:
(由机构提供资料)