上周,在上海接连举行了两场高级别的会议——2018世界人工智能大会和中国国际工业博览会,其主题论坛的屏幕上,除了PPT还多了一个新角色——科大讯飞的讯飞听见,为现场提供语音识别和翻译工作。然而,这场AI落地最直观的“秀”却在会议结束后引发巨大争议。
工博会系列活动之2018创新与新兴产业发展国际会议(IEID)的一场高端装备技术与产业分会上,现场同传译员、知乎用户Bell Wang爆料称,科大讯飞是在识别出译员说的中文译文后,再将译文投放到屏幕和直播中,此举事先并没告知自己,涉嫌冒名使用翻译成果和侵犯知识产权。
此后,科大讯飞两次对此做出回应,强调从未“隐瞒”转写同传声音,不存在侵犯同声传译知识产权的可能性。最新消息称,科大讯飞已与Bell Wang进行了沟通,Bell Wang接受科大讯飞的解释。
此事之所以引发如此风波,恰因它戳中了人们对人工智能一直存在的心结:机器人会不会替代人类?哪些工种未来会消失?
人工智能翻译机自面世以来,就一直被冠以“很好很强大”的标签,译员被替代似乎也是一件顺理成章的事,但事实证明,要想真正做到“信达雅”,AI的能力还远远不够。
翻译机暂时还不能帮助译员
当Bell Wang爆出科大讯飞翻译机“引用”了译员的翻译成果之后,科大讯飞对此的解释是“人机耦合”,科大讯飞机器翻译产品经理刘晨璇向媒体表示,“人机耦合”可以降低译员工作者工作强度、赋能翻译人员。但是,记者采访的几位同传译员都表示,基本上不会接收翻译机给出的信息。
小月(化名)是一名从事同传工作7年的译员,在她看来,译员在工作期间基本用不上翻译机。“在进行翻译时,以听和说为主,同传间电脑上播放演讲者的PPT只是作为参考,还要事先准备相关的单词表,基本没法分心去看其他资料。而且很多演讲者会即兴发挥,此时,译员必须‘抛弃’手中的材料,边听边译边说,集中精力很重要。”更为关键的是,翻译机无法保证百分之百的准确率。“尤其是碰到口音比较重的演讲者,翻译机更容易出错,如果以翻译机的翻译结果为准,也会出现差错或带来干扰。” 小月说道。
德英汉译员高大玉对此也深有同感,她告诉《IT时报》记者,以进行德汉翻译为例,如果听到德语方言,在她脑中,首先要把德语方言转化为标准德语,再把标准德语转化为汉语。如果由翻译机来翻译,对于德语方言的把握不一定很准确,“翻译机比较固化,设置德汉翻译,它只能进行德汉翻译,如果演讲者夹杂说几句英文,翻译机就会识别错误或者识别不出来。翻译现场会出现很多意外情况,例如一词多义,是翻译机没有办法应付的。”在高大玉看来,翻译机最适合做的是说明性文章的翻译,比较硬性,文学性和口语化程度较低的文章,“人说出的话偏口语化,前后语序会根据演讲者的习惯变化,译员会根据听到的单词调整逻辑顺序,翻译机则不行,形式语言不可能代替自然语言。”
会务市场译员地位很牢固
在新技术不断迭代的今天,每天都在举行数不胜数的会议、论坛,其中很大一部分需要翻译,当人工智能翻译机出现后,也有一些会议屏幕上出现了同步翻译,它们让译员们担心吗?
主要承接金融和互联网会议的会务服务商万池文化创始人李超告诉《IT时报》记者,目前,很少有客户在筹办会议时提出要用翻译机,基本上大家默认的都是用译员,因为翻译机的准确率、应变能力有待考量。“我们会向客户推荐一些智能产品,但不是翻译机,目前,翻译机在会务用途上的占比还是很低的。”李超说,和翻译机相比,请译员要付出的成本会高很多,一个资深译员每小时至少2000元起,而一个翻译机也就上千元,而且能够重复使用,但大家还是倾向于译员。这个“日进千金”的行业看似风光,实则是对译员的“脑力压榨”。
记者采访了几家企业,他们均表示筹办会议时没有考虑过翻译机,第一选择还是译员。“我们认为译员比较靠谱,尤其是一些比较技术性的高端会议或者权威研讨,而翻译机还是旅游自用比较好。”一家金融科技企业的相关人士表示。
数据显示,全球95%的国际高端会议都会采用同声传译的方式进行。陆先生是人工智能语音公司凝趣科技的销售人员,他告诉《IT时报》记者,他们的产品以个人用户为主,在会务上推广翻译机的难度很大,“会务翻译对于专业度的要求更高,因此,需要更长的开发周期和更高的研发成本,因此市场占有率非常小,对于我们来说营销难度也比较高。”
在翻译圈内,译员们的心态相当乐观,一致认为译员的饭碗稳得很,绝不会被机器抢走。
人机耦合要技术也要伦理
对于Bell Wang的爆料,一位曾在IEID现场参会的同事告诉记者,科大讯飞董事长刘庆峰在当天也有演讲,且在演讲中坦承,IEID的翻译采用了人机耦合的方式,并不是机器离线翻译。这点侧面印证了科大讯飞的回应。事实上,现场刘庆峰明确表示,人机耦合是人工智能下一步的关键技术之一,“人机耦合将协助我们提高效率,也就是人工智能系统和人类行为协作结合大幅提高工作效率,这种方式不仅仅是技术发展趋势,更是社会伦理发展的需求。”
之所以如此强调人机耦合,是因为目前对于语音、语义的识别,人工智能领域内仍有很多难以解决的问题。专注于智能语音、语义理解等人工智能技术研究与应用的捷通华声CTO李健告诉《IT时报》记者,翻译机不是一个单一的翻译系统,它至少融合了语音识别、机器翻译以及语音合成三项技术的复杂系统,在输入正确的情况下,有些翻译确实已经媲美人类,但在语音识别方面,机器与人的差距明显,“安静环境下,一般语音识别可以达到90%以上的准确率,但在复杂环境下,特别是嘈杂多人的会议场景中,就算目前最顶尖的语音识别公司,识别率也只有70%-80%,这意味着,当机器翻译时已经有20%~30%识别是错误的,而人类在复杂环境下的语音识别率至少在95%以上。”
此外,单纯从翻译角度来讲,目前基于深度学习的机器翻译,对于训练过的文本语料或者类似文本,或许可以翻译得很好,但对于和训练文本差异很大的文本,翻译能力便会大幅度下降,机器不具备人类面对复杂情况的应变能力和面对错误的纠错联想能力。
李健表示,人机耦合是人和机器的优势互补,达到1+1>2的效果,这点在速记行业已经得到很好验证,但翻译是个远比速记复杂的系统工作,人工智能目前的学习能力还不够。
在科大讯飞两次回应后,Bell Wang表示接受解释,但同时他也建议,科大讯飞未来与译员可能合作时,需要得到译员的知情同意,并签订协议;需要使用译员有知识产权的翻译内容时,也需要得到许可。这其实是对新技术下的法律和伦理提出了新的要求。
复旦大学哲学系教授徐英瑾认为,即使人机耦合也有伦理责任,涉及知识产权,“如果人机耦合中,人类并不知道自己的成果被利用,那这并不是真正的人机耦合。”