当前位置:首页 > 爆料 > 正文内容

苹果Siri现侮辱性翻译?侮辱性翻译如何触发

cytd2019-06-26 23:24爆料1568

作为苹果设备的一款标配智能语音助手,Siri除了会讲笑话,还会B-box,教你撩妹,却也常常语出惊人。“调戏”Siri已经成为用户日常。 近日,Siri却因为翻译功能Bug背上“侮X”的名号。从机器翻译的技术角度来看,这事苹果多少有些“委屈”。 事出有因。 昨日,细心网友发现 iPhone 在涉及“华为牛bi”、“小米牛bi”等关键词翻译至英文时,会出现侮辱性词汇“bitch”;但翻译“苹果牛bi”关键词句时却能显示正确英文结果。 在iPhone、iPad上使用Siri语音助手均会出现近似翻译结果,结果对比明显且复现率高,很快这个消息在社交媒体上炸开了锅。 截止发稿前,苹果Siri的翻译功能已经部分从服务器端取消涉及“牛bi”的词条。直接询问“……英文怎么说”将反馈“这已经超出我的能力范围”,但在调出翻译功能界面后,仍能进行相关翻译结果呈现。 不少网友和自媒体将其解读为“侮X”的意图,但从机器翻译和机器学习的技术角度来看,这个帽子扣得有点“委屈”。 1傻傻分不清楚

昨日网友的翻译测试结果 为了进一步验证Siri的翻译功能Bug,我们进行了多轮测试,参考今日早上9点到10点时间段的测试结果。 目前,苹果Siri已经停止部分翻译功能,直接询问Siri“……英文怎么说”时,系统将反馈“已经超出我的能力范围”,但在调出翻译功能后,仍能看到相关翻译结果呈现。 翻译结果1
翻译结果2
翻译结果3
翻译结果4
这里,小米直接翻译成“Mimi”,实在令人费解。 可以看到在多轮翻译测试中,Siri对于“牛bi”的理解和翻译结果很不稳定,有将“牛bi”翻译成了“bitch”、也有翻译成“so good”、“awesome”、“bullish”,显然后者翻译更为贴切中文中“牛X”的含义。 但是,以上翻译结果还不至于将Siri翻译结果套用“阴谋论”,说不通的地方在于——见过骂自己CEO的手机吗?
稍微改变中文语法,翻译结果又恢复了正常。
在中文,“牛bi”也被写作牛B,多指“厉害”、“强”的意思,有时会简称为“牛”。 在维基百科(英文版)中,“Bitch”作为名词共有11种意思,均涉及包含粗俗、冒犯、进攻性质的负面词汇含义,唯一第九种是中性含义,指代纸牌中的黑桃皇后。 为什么Siri能翻译出“bitch”这种字眼? 很大程度在于,Siri在面对不能理解的句型语法时将采取直译方式。这个时候,中文语句中的“bi”就成了主系表句型中的表语。对此,我们同样进行了测试验证。
将翻译有问题的句子去掉中文中的“bi”,比如“华为真牛”,Siri通常会翻译成“XXX is a real cow”、“ is a real ox”。这也侧面论证了Siri翻译背后所采用的“看见不懂就直译”的路径存在。 2机器翻译背后的技术解密 2011年10月,Siri随着 iPhone 4S 的发布问世,成为iPhone设备的标配功能,如今AI语音助手也已经成为智能手机上的标配。 就目前技术发展阶段来看,手机语音助手交互原理在于,设备根据采集的关键词,来触发底层回答的指令。服务器端有编辑好的相应关键字和词条,当用户通过手机等设备发问时,算法搜索最为相关词条并呈现答案,可能为一个或多个。翻译问答的交互方式同理。 虽然在模型的训练阶段,已经出现神经机器翻译等更人工智能化的理解方式,但在推理阶段,AI语音助手尚不能达到完全理解人类“语言”的水平。 具体来看看机器翻译技术本身。 机器翻译,又称自动翻译,简言之即是借机器之力自动地将一种自然语言文本(源语言)翻译成另一种自然语言文本(目标语言)。 采用机器做翻译的思想最早由 Warren Weaver 于 1949 年提出。大半个世纪以来,机器翻译技术先后了 基于规则的机器翻译(RBMT)、统计机器翻译(SMT)、神经机器翻译(NMT)三次重要的方法演化。 神经机器翻译,Neural Machine Translation, 简称 NMT, 于2014年开始兴起,逐渐应用卷积神经网络(CNN),递归神经网络(RNN),注意力机制等技术。 神经机器翻译的优势在于长句子、甚至段落的翻译能力,阅读起来上下文连贯程度接近人翻。目前,神经机器翻译已经成为机器学习技术领域的主流。 2016年开始,神经机器翻译已基本全面取代传统的统计机器翻译(SMT),Google、微软、百度、搜狗等已相继上线神经机器翻译系统。 在英文中,单词在一个语境下通常只代表一个意思;而在中文里,一个字放在主、谓、定等不同的位置和语境中,代表的意思就有很多可能性,这也是中文博大精深之所在。
图片源于网络 在本文开头描述的情况中,Siri因为根本没有理解关键词的意思,所以采用了直译,即通过拆分成“单字”的模式寻找匹配词条,“牛”直接翻译成ox、cow(另一个词同理)。不得不说,已经八岁的Siri对于中文语法的理解仍然处于比较“低端”水平。 当然,在中英翻译上栽跟头的又何止Siri这种“外来客”。前段时间,微信自带的文字翻译功能也是十分任性。
以及再一次掀起清华北大之争的“神翻译”。
随后,微信团队便部分下线了翻译功能。腾讯微信团队微在微博上回应称,翻译引擎在翻译一些没有进行过训练的非正式英文词汇时出现误翻,导致部分语句翻译出现问题。 这也充分说明了基于人工智能的技术手段,在算法和模型足够领先之外,语料,尤其是平行语料的训练仍是高质量翻译的核心。 所谓,“平行语料“即指的是源语音与目标语言一一对应的关系,比如,“I love you” = 我爱你”。而在微信的案例中,很有可能就是爬取并采用了网上已经存在的大量“caixukun=好”、 “caixukun=傻蛋”的语料。 对于Siri等“外来客”而言,中英互译效果不尽如意的很一大部分原因在于,我国用户对其调用率和使用率不高,本土化语料的训练量不够大,所以在面对一些本土化的东西,显得有些“智障”。这也就能解释前文提到的例子,由于对美国之外的品牌不够熟悉,Siri将“小米” 翻译成“Mimi”。 “主要是训练数据的覆盖,如果覆盖不好就要针对特定用语进行修正”,Facebook前机器翻译专家向机器之心表示, “Siri出现的这个情况应该不是有意的,很可能是他们现有的模型对于『牛bi』都翻译不好,但对于『苹果』和其有关的说法做了bad case修复”。 一般来说,训练语料主要来自三个方面,一是各种英汉辞典标准化语库来源;二是互联网上的爬虫抓取,从全网大量的数据里,抓取到所需要的高质量平行语料。 第三,则是各家公司能够“各取所需”的优势渠道,比如腾讯有大量基于微信平台有大量社交的语料,阿里巴巴有大量基于电商平台有大量交易的语料,或者其他公司通过付费购买特定场景语料。 那么新的问题来了,Siri 在中国市场的翻译功能,会是谁提供的语料和API呢?

扫描二维码推送至手机访问。

版权声明:本文由4K智能学习网发布,如需转载请注明出处。

本文链接:https://4k3.cn/post/12791.html

分享给朋友:

“苹果Siri现侮辱性翻译?侮辱性翻译如何触发” 的相关文章

《夜·中国》的绚烂,正是因为他们的默默守候

《夜·中国》的绚烂,正是因为他们的默默守候

都市的白天往往是井然有序的,人们在工作中忙碌,为生计而奔波,无暇顾及隐藏在忙碌背后真实的思绪。但当天色渐渐变暗,霓虹灯悄然亮起,车流汇聚在嘈杂的街头,这时,绷紧的心弦得以放松。午夜梦回,你可知依然有默默坚守岗位的人让这座城市得以健康安宁。 就在2月18日,京东、一加手机(OnePlus)和Lonely Planet(孤独星球)定制的旅行读物《夜·中国》,记录下了这些行走在夜晚的小人物。如北上广深的CBD中,隐藏的一个个为命运打拼的白领;城市街头巷尾中,驻扎的手法娴...

罗永浩,英雄因何末路?锤子的情怀被现实击得粉碎

无论是创办牛博网,做老罗英语培训,还是做砸西门子冰箱之类的举动,老罗都受到了欢迎。但锤子手机却带来无数争议,甚至谩骂,问题出在哪里? 所有人都在等着锤子科技最终的结局:还会有锤子手机吗?罗永浩将何去何从? 在刚刚过去的2月,罗永浩先后退出天津云上漫步科技合伙企业(有限合伙)和天津云上畅游科技合伙企业(有限合伙)股东行列,两家公司实际控制人变为王威。 这两家公司是聊天宝主体公司北京快如科技的股东,聊天宝的前身是大名鼎鼎的“子弹短信”,它在2018年像一颗耀眼...

华为强势宣布:又一款5G手机诞生,三星苹果已看呆!

3月15日,产业链给出消息称,华为旗下首款非折叠屏5G手机Mate 20 X 5G版已经准备就绪,可能会比Mate X更早上市,其搭配了华为的自主5G基带巴龙5000,这是目前全球商用中最快的5G基带。 华为Mate20X是2018年发布Mate 20系列中的其中一款机型,采用7.2英寸水滴屏,搭载麒麟980芯片,内置5000mAh的大电池,采用石墨烯散热技术;华为Mate 20X拥有和华为Mate20 Pro一样的后置三摄设计,搭载4000万像素广角镜头+2...

小米手环4有消息了!最迟春季推出,健身功能又有新玩法?

近年来小米大力发展所谓的生态链模式,推出了不少受到消费者支持的智能配件。其中,小米手环系列产品有着不错的性价比,功能也比较齐全,一直都是受到消费者欢迎的小米智能产品之一。 去年6月,小米手环3伴随着小米8系列正式发布,相比前代产品小米手环3主要特点是增大了显示屏幕的尺寸,在健身功能也也有一定升级等。不知不觉间小米手环3都发布了9个月了,如此看来也差不多到了该更新换代的时间。 据外媒FirstPost报道,云米首席财务官崔大伟(David Cui)在接受采访的...

正式版要来了:苹果发iOS 12.2第六个测试版

正式版要来了:苹果发iOS 12.2第六个测试版

今天早些时候,苹果悄悄发布 iOS 12.2第六个测试版,而一同推出的还有公测版,如果不出意外相应的正式版已经在来的路上了。 iOS 12.2 beta 6的版本号是16E5227a,主要是修复Bug,并且提高系统的稳定性,至于新版功能之前已经陆续加过了,比如新的表情、Apple News等。 之前的消息显示,苹果将在本月底发布iOS 12.2的正式版,其将提供流媒体视频服务,而有不少内容是针对果粉免费的。 上一个测试版中,iOS 12.2 Beta 5提升了...

小米9与抖音合作,推出独家新功能

3月27日消息 今日早间,@小米手机官方微博发文表示,小米9与短视频平台抖音达成合作,推出独家新功能。 小米9独家新功能为:1、系统相机随手拍,内置热门滤镜、魔法道具、美颜、音乐等功能,拍抖音更省心,上传更快捷;2、支持117°超广角视频拍摄,视野更广内容更有趣。...