original="https://ocpk3ohd2.qnssl.com/uploads/image/file/6f/7f/6f7fa46cef0bba66b4e4650be8283c7b.jpg" data-vw="60" data-action="zoom" />
零售业「无人化」是今年科技领域的一大热点,在之前,我曾经和大家讨论过当下「无人便利店」的机遇和存在的困境,而时隔不久,「无人超市」又出现在我们视线中,这一次的玩家是阿里巴巴。
7 月 7 日,极客公园提前体验了一把阿里无人店「淘咖啡」,虽然叫「淘咖啡」,实际上也是综合型的小型零售超市,整个购物流程非常简单:进店前,先打开手机,用支付宝扫二维码绑定支付宝账户,并授权小额代扣(每天每人上限 5000 块),完成后用手机扫码过闸机。这时候就能进店挑选商品,和平时逛商场一样,当你挑好物品后,可以拿在手里,或放在购物袋里,甚至直接放进随身背的包里。
在「淘咖啡」的出口,有一个预设的玻璃通道,当你要通过时,系统会对你买到的东西进行结算,然后你只管出门,需要知道花了多钱的话,手机会收到推送信息,包括了购物清单以及扣款总额。
这套物联网支付技术,是由蚂蚁金服技术实验室研发完成。据了解,这是一个专注于 VR、IoT、区块链等前沿技术研发的团队,而去年年底,蚂蚁金服发布的全球首个落地应用的 VR 支付技术,就来自于这个实验室。
虽说现在这样的便利店离我们的生活还有点距离,但体验下来确实感觉非常酷。所以让人好奇的是,这其中究竟具体会应用到哪些技术,才能最终实现完整的购物流程?
针对这个问题,我们也和蚂蚁金服的工作人员聊了聊,对方向我们简单介绍了其中的一些技术运用,但并不详细,所以我从现场情况推断了一些技术方法,不妨和大家聊聊:
骨骼分析
据了解,「淘咖啡」面积 200 平方米,内部压力测试结果显示,同时在店人数 50 人基本没问题。
蚂蚁金服的工程师介绍说,「淘咖啡」在物联网支付方案用的是多模态识别,即计算机视觉叠加传感器感应。
这两项技术方案运用的权重比例,蚂蚁方面没有透露。对此我试着做了一些猜想:
首先,多模态生物识别是指整合或融合两种及两种以上生物识别特征,利用多重生物识别技术的独特优势,这其中就包括了人脸、指纹、虹膜甚至是骨骼分析等方式。通过多种技术+数据分析,能够使认证和识别过程更加精准、安全。
而如果说计算机视觉技术用的权重更大,那么有可能是用了人脸识别+骨骼分析的技术。人脸识别大家都已经比较了解了,手机上也有不少应用都会用到,我们不妨看看为什么可能会有骨骼分析技术吧。
简单来说,骨骼分析就是在摄像头眼中,在超市里走过来走过去的,只是一堆堆骨头,骨头之间再怎么叠加、交叉,基本还是可以被识别出来哪根骨头是谁的,这对于保证多人同时在店购物的识别精准度,起到重要作用。
而之所以推测骨骼分析,不是现阶段较成熟的图像分割技术(即把捕捉对象的边缘分割出来,从而去识别对象的行为),是因为后者存在一个问题,就是当店里人数一多,摄像头就容易抓瞎:假如十几个人同时在抢购同一款商品;或者几个人手交叉着去拿各自想要的商品,对图像分割来说,非常容易出现混乱。
所以,假如「淘咖啡」能够同时允许 50 人在店内活动的话,图像分割技术确实不如骨骼分析来的靠谱,也许就是包括了人脸识别+骨骼分析这两种结合在一起的结果。
眼动追踪:
在逛「淘咖啡」时,工人还在现场布置天花板上方的摄像头和传感器,根据摄像头数量和摆放位置,我推测「淘咖啡」店还叠加了眼动追踪系统。
「眼动追踪」可能会让一些人想起来当年在三星手机上,那个根据人眼动作来自动浏览手机内容的功能,不过当时那项技术实际使用效果并不如想象中美好,所以后来也在三星的机型中取消了这个功能。
但之所以推测「淘咖啡」会有这样的系统,是因为它可以捕捉两个维度的信息:
一是店内,包括店内的实时热力图:客人最喜欢走哪条路线,哪个货架的客流量最密集,哪个货架人流停留的时间最长,哪个货架比较冷清等等。
第二是用户,比如甜品货架前的客人男女比例如何,平均体型偏胖还是偏瘦;客人站在货架前,眼睛最习惯首先往哪里看(以推算出货架真正的黄金位置)。
实际上之所以这么推测,也是因为在物体识别领域,计算机视觉普遍被认为是识别人与商品的未来主流方向,我们曾经介绍过的 Amazon Go 就是一个典范。阿里在这个方向上显然也是很有想法,「淘咖啡」公测前不久,阿里宣布负责 Amazon Go 首席科学家任晓枫加盟,巧合中有必然。
深度决策算法:
这主要是用在后台的数据回流和数据挖掘。这其实也是无人超市最大的意义所在,无论是 Amazon Go 还是蚂蚁金服,雇一堆身价很高的工程师来研发无人超市,可不只是让大家体验一把黑科技的酷炫感的。其背后最大的价值,在于回收、分析基本面数据(比如商场热力图)以及沉淀用户画像,以帮助线下实体店更高效、更精准地优化供应链以及货架的摆放。
比如,工作日和周末、各种小长假中,在最显眼的展架上该放什么商品;还能根据客人的平均身高来调整货架的高低。甚至还能做一些预测,比如看到什么样的产品放在偏僻的地方仍然会有不错的销量,那么就要进行相应调整,让大家更容易发现它们。
说到算法模型,对蚂蚁金服来说一直是比较擅长的。AI 在其各业务场景都起到底层技术支撑,如保险、理财、小额贷款、智能客服等等。这应该是之后会在「无人便利店」这样的场景下深挖的一部分内容。
多模态识别:
刚才说了,除了计算机视觉,「淘咖啡」还叠加运用了传感器。在业界,大家都有一个基本的共识,单一维度的技术往往很难保证足够的安全性和足够好的体验感,所以,无论是物联网还是生物识别,只要想在商用场景落地,都会考虑叠加运用几种技术来进行交叉验证,也就是多模态识别。
Amazon Go 也是采用的计算机视觉+传感器感应(可能还有+生物识别)来降低误判率。因此,市场中有做物联网支付方案的公司强调说自己用的是纯计算机视觉,而实际上这对树立投资界以及公众对其进入商用的信心和安全感,并没有什么好处。
「淘咖啡」的客人在挑好东西后,要通过一个「支付门」才能出去。这个门每次只能一人进去,门里的各种摄像头和接收器要对人和商品做即时识别。
现场有人做了踢馆测试:几个商品横七竖八随意放在购物袋里;一些商品放在购物袋,一些放在书包里,一些拿在手上。最后都轻松通过并扣款无误,这似乎也说明,「淘咖啡」内不仅仅是计算机视觉技术这一种。
下面来看看蚂蚁金服工程师内测的 GIF:
结合「支付门」里布置的摄像头以及感应接收器,我推断「淘咖啡」是混搭结合了 RFID 天线,你可以理解为是增强版 RFID,以扩大天线的覆盖范围,加强对商品位置的定位,减少误读。
另外值得注意的是,蚂蚁金服官方披露的技术方案中有生物识别,但从现场体验来看,人是不需要在摄像头前特地停留以配合识别的,所以估计这其中用了人脸+体态+体重等多维识别。
这个「支付门」是「淘咖啡」区别于其他无人超市的一个亮点,同时也是一个缺点,至少在现阶段来看。因为用户在经过这个门时,并不能真的「即拿即走」,还需要等五六秒左右才能出门。
据介绍这个等待的时间不是系统识别和自动划扣造成的,是滑动门造成的,根据行业标准规定,它的安全关门速度就得这样……好吧,所以这个门应该是个过渡阶段的版本。
以上,是根据体验以及询问之后,我们做出的一些猜想,虽然看起来可能离我们实际生活还有一段距离,但我们很欣喜的看到,从「无现金」再到「无人」的一系列变化,我们生活中的一些场景确实因为科技的进步在发生变化。
当然,「无人超市」要做到真正无人还是有距离的,至少在上货、运营维护甚至在商品数据库如何建立上都要投入人力来完成,并且被人不看好的另一个原因是如何能降低成本,尽量降低风险,这也都是我们这个社会对其发起的挑战,商业模式究竟如何落地,最终都是值得关注的。
虽说「无人超市」这样的事在长期以来一直是停留在愚人节科技玩笑里的存在,甚至在去年 Amazon 宣布 Amazon Go 后,仍有一部分声音认为它的噱头大过实际效果。但去年到今年不少朝这个方向努力的公司都有了进展,我想,待技术成熟落地之日,再来看现在,也许会有不一样的感受吧。(编辑:早优夫斯基)