彼此相安无事几年后,国产翻译软件们正在遭遇最强外敌。
近期,谷歌翻译在微信朋友圈投放一系列广告,用于展示谷歌翻译 Word Lens(即实时相机翻译)的功能。
在中国市场沉寂多时后,这是谷歌久违的动静。科技迷对于这次广告试水也显得相当兴奋,长句翻译、专业术语甚至外延产品谷歌实时翻译耳机,都成为了关注的焦点。
这加剧了翻译市场的紧张气氛。外界不断将国产翻译软件与谷歌翻译进行对比,议论哪个竞品需要担心。
对比用户们的跃跃欲试,在国内市场扎根多年的国产翻译软件们正互相观察,试图找到一个答案:劲敌当前,谁或成为最大输家?
一、进击的谷歌
这不是谷歌翻译第一次在朋友圈投放广告。
今年 3 月 29 日,谷歌翻译 App 更新至 5.8 版本,不仅增加了 Word Lens 功能(意为通过神经网络识别图像中的文字,然后再转化成对应所需求的文字),更重要的是,其 App 首次对中国用户开放。彼时,谷歌翻译也投放了一系列广告。
和 3 月的投放相比,近期的广告依然集中推广 Word Lens、语音翻译和手写翻译功能。只是将主题设定为城市探索,同时邀请今年嘻哈热潮中的代表人物“HipHopMan” 欧阳靖进行宣传,以吸引更多年轻用户。
屡次投放广告,谷歌翻译对于中国市场的迫切由此可见。虽然在过去八年中,中国用户可以在网页端使用谷歌翻译,但移动端应用的缺席,让谷歌翻译在中国市场失去了不少机会。
此次移动端应用终于落地,谷歌展开一系列攻势也属正常。面对谷歌的强烈攻势,国内的翻译软件们应该紧张吗?
至少以目前的功能看,每家都大同小异。从输入法看,目前的翻译 App 都提供键盘输入、手写输入、语音输入、摄像头采集等多种场景下的服务;此外,提供的翻译服务从过去的词组、句子翻译升级为整段翻译、语音翻译、实景翻译等。不仅如此,各家翻译 App 还通过语言包开启了离线翻译功能。
除了以上种种,谷歌翻译还提供 “点按翻译”(Tap to translate),意味着可以直接在其他 App 上使用 Google 翻译而无需切换界面,升级用户体验。
既然功能相似度极高,“后浪”谷歌凭借什么逼近国产翻译软件的护城河呢?
区别各类翻译软件的,不是表面各项功能,而是功能背后的技术。经过 PBMT(基于词组的机器翻译)与 SMT(统计翻译模型)时代的竞争,如今翻译技术已经进入了 NMT(神经网络翻译)时代。此前,PBMT 的翻译单位是词组,无法解决词序和语法问题,因此在长句及专业表达上显得差强人意。
如今,NMT 却尝试反其道行之:将整句作为翻译单位,利用上下文信息进行多义词的判定,最后进行逻辑性的关联翻译。相比之下,NMT 的翻译成果更接近日常用语习惯。
同时,NMT 系统会收集用户反馈训练自身,利用大数据倒推新的规则以补充知识图谱。目前,谷歌、微软、有道、科大讯飞、百度等巨头在翻译方面均更新了 NMT 系统,以期在 AI 时代一决胜负。
而谷歌翻译,在数据运用方面无疑具有更多的话语权。在 2006 年翻译业务上线后,谷歌以搜索引擎的身份不断收集数据,而开发的安卓系统更是在搜集移动数据方面助力良多。如吴军在《智能时代》里所描述的,2005 年谷歌翻译曾凭借更多的数据,在美国翻译界大赛上秒杀老牌翻译公司。
凭借深厚的积累,谷歌在大数据时代的竞争中给对手们带来了更多的压力。
二、群雄逐鹿
在庞大而充满变数的中国市场,不断打广告的谷歌,并非如外界想象得信心满满。
将 NMT 运用于翻译,谷歌并非行业第一人。早在 2015 年,百度就上线了世界上首个 NMT 系统,而谷歌则在 2016 年才推出类似的系统。
在中国市场,姗姗来迟的谷歌面对人满为患的竞技场,需要展示更多的优势吸引用户。
虽然谷歌在数据领域已是专家,但在中文数据搜集方面,由于用户的使用习惯和频率,谷歌并不具备优势。
同时,当业内的竞争者都完成技术升级后,谷歌翻译在十年前靠海量数据形成的优势将逐渐消弭。
某种程度上,谷歌翻译和国内翻译软件站在了同一起跑线上。复旦中国研究院副研究员余亮向笔者表示,技术上各家处于同一个层次,技术如何落地将决定下一赛程的结果。
想要跑赢翻译竞争的后半段,硬核在于信息基础。余亮表示,翻译技术身后需强大的技术库以及知识图谱作为支撑。知识图谱作为人工智能大脑的基础,需要耗费大量的资源构建。同时,在海量搜索的数据间建立复杂、多维的联系,通过对语言的分解、关联以及数据化进行训练后,形成庞大的知识库,以获得对提问自动判断的能力。
虽然 NMT 潜力巨大,现阶段牢牢把握中国用户的是有道翻译。在 NMT 出现之前,外界的聚光灯集中于有道翻译。
比达咨询(BDR)5 月的监测数据显示,国内语言工具类 APP 月活跃用户数方面,有道词典月活跃用户数为 4312.2 万人,而第二名金山词霸为 926.5 万人,两者之间差距不小。
在进入 NMT 时代之前,有道词典凭借良好的用户体验以及 UI 设计获得了用户青睐。
今年 5 月,有道翻译上线了 NMT 翻译技术,迟到的 NMT 技术能帮助有道持续占领翻译市场吗?
恐怕很难。在未来翻译战争中,搜索引擎扮演了关键角色。基于用户的百亿搜索量,搜索引擎公司相对于其他互联网公司,将积累更多的数据。这将帮助神经系统不断训练与打磨,成熟度会远高于其他的互联网公司神经系统。
11 月,在 2017 世界人工智能大会上,百度副总裁、AI 技术平台体系总负责人王海峰就曾表示,百度正在打磨知识图谱。
不仅是余亮,曾在谷歌和腾讯工作过的吴军也曾公开表示过,未来在翻译领域前两名将会是谷歌与百度。因为二者都以搜索引擎起家,在数据搜集上有先天的优势,而这一优势今后会发挥马太效应,逐步扩大。
三、落地为王
长期以来,翻译服务一直被认为是巨头扎堆的小市场,盈利不易但技术投入巨大。除了百度、谷歌等面世许久的翻译软件,腾讯前不久也推出了“腾讯翻译君”,该产品用于中英同声传译服务。
今年 7 月,阿里巴巴披露的一份技术资料显示,阿里翻译团队通过优化阿里云机器学习平台 PAI,应用于英俄电商翻译质量优化项目中。
同一时段,大洋彼岸的 Facebook 也宣布面向全球推出 NMT,用于 Facebook 中上百种语言的翻译,并且达到每天 45 亿次的翻译量。
一时间,全球的互联网巨头都在翻译市场发力。
巨头的涌入不能说明翻译市场的吸金力。2013 年 9 月,有道词典宣布在第三季度实现盈利。但除了有道,排名第二的金山词霸至今在盈利问题上含糊其辞。
在今年 5 月,北京金山办公软件股份有限公司(以下简称“金山办公”)披露了招股说明书,却未公布 WPS Office 办公软件和金山词霸的财务数据。
既然盈利不易,为什么巨头对这片市场充满了征服欲呢?其实,在翻译技术身后,有无数的外延产品,这将为巨头们带来新的红海。
在国外,谷歌正在重点推谷歌 home,即谷歌智能家居,作为一个家庭互联网的入口,与亚马逊争斗市场份额。在国内,几家互联网巨头都已推出智能音箱。
以最近的零售大战数据看,双十一期间天猫精灵售出 100 万台,在国外黑色星期五期间,亚马逊 Echo 智能音箱销售约为 800 万台。
仅是智能音箱一项,就可以为公司带来不小的收益。而在技术成熟后,落地产品将会越来越多。余亮表示,谷歌和百度这类搜索公司,愿意暂时烧钱在翻译市场,其实是尝试互联网的“破坏式创新”,未来在数据积累达到一定程度时,百度和谷歌将通过别的业务赚钱。
而如网易这类在 AI 上没有过多技术基础的公司,正在尝试教育方向的延伸,例如网易课堂。
在不同业务背景的加持下,未来各个翻译公司的外延产品差距会逐渐拉大,能否回笼前期的投入资金,才能决定最后的赢家。
谷歌的入局不会宣布输家的人选。相反,这场由 NMT 开始的翻译大战,才刚刚开始。