中国山寨 Firefly,只是听起来不错的主意" />
李书航/文
昨天起已经被亚马逊手机的消息占据了整个头版。不谈手机本身如何,光是亚马逊和手机这两个名词结合,就足以勾起绝大部分人的评论兴趣。而这个手机当中可以被称为hashoujian.html" target="_blank">杀手锏的功能 Firefly,用摄像头拍照来识别物体并直接购买,更是被大家研究了一个底朝天。
这让我想起苹果的语音助手 siri 刚刚发布的那个时刻。在那之后不到半年时间,国内雨后春笋一下子冒出十几个语音助手。有的昙花一现,但绝大多数都跟着不同的手机操作系统移植存活下来。虽然也不知道这些助手目前的利用率是怎样的,但是他确实成为了手机 ROM 的标配。更夸张的是最新一代的讯飞输入法。在输入法的设置界面,我们通常都应该看到的是皮肤词库等设置信息。然而讯飞的设置界面最开始就是一个语音助手,这个内嵌进去的助手还不能删除。
有足够的理由相信,如果亚马逊的 Firefly 被证明无比炫酷,而且也在技术上可以实施。那么国内一定会再有那么十几家把同样的功能复制到他们自己的 ROM 里面。我现在也不是很清楚语音助手的最终使用率,但是我觉得在摄像头搜索这件事情上,比起“怎么做”,“谁来做”这一点可能更重要。
由单独一家电商企业来推出摄像头搜索功能,数据库又是基于自己库存,这跟一个搜索引擎来做是两码事儿。亚马逊的两亿种商品也许是全世界最大的单个商品库,但是全世界能够被用来买卖的物品也许有数十亿种。别的不说,就说在中国市场,没有一家能单独做这种搜索,就连淘宝也够呛。
更何况,中国的老百姓喜欢在不同的购物网站之间比价。在亚马逊具有垄断地位的市场当中,比价似乎没什么必要,但是在中国似乎很有必要。6 月 18 号,刚刚又一个电商烧钱的日子过去了,在平时,各站的价格可能相差无几,但是在促销的时候就很有可能有很大的不同。很显然,顾客们要的并不是亚马逊自己一家的购物搜索。而亚马逊可以大度到让竞争对手的产品进入自己的商品搜索范围吗?整合不同电商的事情,恐怕只有谷歌才能做出来。
目前因为技术方面尚不成熟,Firefly 主要是在图书音像等等比较格式化和规范的产品当中应用。但恰巧是图书音像,没有办法在中国用电商的形式来实现。中国人想看的电影都在国外呢——而且有一些根本没有官方引进。中国人遇到好看的影视剧,到底有没有购买 DVD 碟片的习惯,这个暂且不提;拥有大量影音资源的,不是淘宝京东亚马逊这类电商网站,而是优酷土豆爱奇艺这样的视频网站。而且在视频网站如此拼独播和自制剧资源的情况下。你要看不同的剧种,还有可能会逼得你去购买不同网站的会员。仅仅靠一家电商网站的搜索,是不可能实现的。
简单的说,Firefly 在美国以外的地区,到底能不能实现都是一个谜。
如果要在中国有人想要复制这种摄像头搜索的功能,走向开放平台几乎是不二的选择。不但产品要开放 API 供其他厂商接入,就连图像识别的技术本身,可能也没有办法凭一己之力就实现同样的高度。正是这一点,让我觉得山寨 Firefly 将会让山寨 Siri 的历史精确的重演。
之所以能够在非常短的时间内有那么多语音助手同时冒出来,是因为他们当中绝大多数都采用了讯飞语音云的技术。提供公开技术和语料库,让“语音识别即服务”的讯飞,几乎成为了语音识别领域联发科一样的神级存在。而小米,搜狗以及其他更多整合在手机 ROM 里面的语音助手,都只不过是讯飞的套牌商。
这也就使得语音助手的同质化非常严重,在成为手机标配以后,就基本上没再管过死活。而第三方参加的活跃度也不如预期,绝大多数的请求都没有被调到第三方应用,还是简单的以搜索网页作为结尾。
语音识别就已经是这个样子了,图像识别则需要更多的技术积累。根据资料,目前以图搜图的方法,是主要用于对比两张完全一样,但是大小不同,或者添加了字迹,特效或者做裁剪的照片。这跟辨别在不同背景之下的同一物体是两码事。如果需要辨别某个实体环境当中的物品,就应该把这个物品的轮廓线在照片当中“抠”出来,然后再比对。然而,比如说你要搜索一套音响,这套音响的音箱放在左右两端,跟放在一起,或者是缺少了一个音箱,这都会导致被识别成完全不同的物体。
对于图像搜索来说,困难更是极端严重,技术壁垒更高。假设真的有企业能够在亚马逊之外作出这种技术(很大可能会是一个搜索引擎),选择把这个技术开源,并且向讯飞一样通过更多的用户使用,来收集更多的图片资料,进一步优化搜索结果。几乎是让这项技术变得可用的唯一出路。要不然,对这种图片搜索的美好未来的憧憬,就只能停留在想像层面。
未来,本来在手机上实现的 Firefly 如果使用智能眼镜来输出,那么就非常美妙了。但是,如果佩戴谷歌眼镜的人只能够使用谷歌的搜索结果,佩戴亚马逊眼镜的人只能够使用亚马逊的搜索结果,而中国消费者则被迫去佩戴百度或者别的哪家推出的眼镜,这当然不是一个很好的未来。
不管是从搜索结果对接的应用种类,还是从识别技术来说。要想让摄像头搜索实现更好的结果,开放是唯一的选择。开放平台也成为做一个山寨版的仅有出路。你可以和十几个小厂商一起推出自己的 Firefly,只需要技术和应用两边都对接上 API 就可以——但是这样做好像也没什么意思。