北京时间 12 月 9 日消息,《连线》杂志刊登署名为格雷格·米勒(Greg Miller) 的文章,介绍了谷歌地图背后的工作秘密。米勒指出,谷歌不仅动用卫星、航空成像技术,还借鉴计算机和机器学习完善算法,同时投入人力手工纠正地图数据。
以下为文章全文:
我们所用的导航地图,虽然问世时间尚短,但却已走过漫漫长路。自 90 年代后,我们彻底抛弃了塞满纸质地图的手提箱,也不再使用地图网站 Wapquest 打印出来的路线图,转而不动心思的遵照 Siri 和谷歌地图指示。
算法成王
事实上,这些地图背后融合的数据量,远超过人们的认识。在最近一次参观山景城的活动上,我有幸一窥谷歌地图团队整理、集成地图信息的工作流程,以及他们如何通过算法结合精细手工操作来锐化地图产品。谷歌将这称之为“地面实况”(Ground Truth)。该公司于 2008 年推出“地面实况”项目,但很大程度上处于保密状态,直到数年前才逐渐对外披露。现今,“地面实况”已覆盖全球 51 个国家和地区,与此同时,在获取卫星、航空以及街景图片信息上,算法发挥的作用愈发重要。
谷歌街景数据在算法上可分离出的一些要素
谷歌于 2007 年推出谷歌街景。负责谷歌地图的副总裁布莱恩·麦克莱顿(Brian McClendon)表示,街景服务被看做是改善用户体验的路径,能够让用户在屏幕前就可看到目的地周边实景。“但我们很快认识到,打造地图的最好方法之一,便是用照片记录全球各个街道,然后参考这些真实的图景”,他说。
谷歌地图产品经理尼克·古普塔(Manik Gupta)表示,随着谷歌街景收集的数据不断增加,地图团队注意到,街景服务的好处不止局限在现场检验地图数据上。到目前为止,谷歌街景车行驶里程已超过 700 万英里,覆盖全美 99% 的公共道路。“这实际上能让我们以期望的方式,通过算法建立新的数据层”,古普塔表示。
谷歌所用的算法,借鉴了计算机视觉和机器学习等领域的方法,来展现路牌、周边商店、限速标志以及其他交通信号标志灯内容。麦克莱顿说:“停车标志不是问题,它们都会突出显示。”转向限制,即在某些交叉路口人们可以转入的方向路线,是导航中的重点,但这些限定指示难以用算法捕捉。有时候,路上会画出指示箭头,告诉人们可以左转或右转,但也有时候,这些指示标线挂在半空。这些指示标线颜色各不相同、而且大小不一。麦克莱顿表示:“道路标线令人头痛,因为它们并不一致,不过我们这处理这方面问题上已经聪明很多了。”
普通用户不会看到的谷歌地图中的转向限制
街道标示也是难题。如果驾驶员听到的语音导航与其所见内容相匹配,他们能更容易地遵照地图应用的语音指引。但有时,街道标示的拼写和缩写五花八门。麦克莱顿称:“与现实街道标示的书写相匹配,实际上是很棘手而且很重要的问题。”
其他算法可以通过卫星和航空成像技术来提出大型建筑印记和高度。当前,全美绝大多数楼宇均收录于谷歌地图中,比如西雅图的地标性建筑太空针塔(the Space Needle)便通过计算机视觉技术呈现 3D 影像。谷歌表示,该公司近期已收购高分辨率卫星成像公司 Skybox。谷歌此举有助于改善旗下地图服务的精确性。
手工修改
然而,卫星和算法完成的工作仅限于此。谷歌还部署了多个人力小组(未明确公布具体数目)来手动检查和纠正地图数据。这些人力小组使用名为“Atlas”的内部程序实施该项工作。此前只有为数不多的外部人士看到过“Atlas”,但在我此次谷歌行时,该小组中的尼克·沃尔玛(Nick Volmar)展示了“Atlas”如何工作。
人力操作员看到的画面,看上去像是谷歌地图和卫星图的混合体,但表示着不同寻常的各种颜色线条和符号。比如,道路会根据方向以不同颜色编码,绿色和红色箭头则表明某个交叉路口可能要转向。沃尔玛点击屏幕一侧的方框,切换各个图层开关,街景中呈现的交通标示便可显示或消失。
沃尔玛还展示了通过点击和拖拽卫星图像的方式,修复失准道路。这看起来很容易,甚至挺有意思,而且与编辑“Open Street Map”并无不同。但沃尔玛与其他人力操作员每天要检查数以万计用户报告的问题,且要予以修复,工作量可想而知。
操作人员可以点击标出一段路,将其拖至与卫星图像相符的位置
除沃尔玛这些人力操作员外,谷歌还通过“MapMaker”程序,从普通民众寻求帮助。“MapMaker”于 2011 年启动,现如今已登陆全球愈 220 个国家和地区,目标旨在为发展中国家以及其他无法使用精确地图源的地区,改善谷歌地图服务。“我们招募用户来添加对他们自己重要的地图信息”,古普塔说,“我们提供了工具和卫星图像,人们可以对此进行纠正。”
在居民住所附近,人们可以提供公园、小路以及街景车无法到达之处的数据信息。麦克莱顿表示:“我通过 GPS 系统记录登上 Windy Hill 的路线,然而可以添加更加精确的小路数据。”
Atlas 中可见谷歌街景数据在算法上捕捉到的街道标示,还有车流量信息
看着沃尔玛演示“Atlas”时,有一种“深源图”的感觉。当你打开谷歌地图时,在实际所看的图像之下,不仅仅是道路信息,还有更多信息以及相关联的逻辑。地图信息已不仅仅是建筑物的形状,还包括内部数据,而地图,未来的“深度”只会不断增加。