雷锋网 AI 科技评论按:本文获微软研究院 AI 头条授权转载,原标题为《大数据 freestyle: 共享单车轨迹数据助力城市合理规划自行车道》,雷锋网 AI 科技评论做了不改动原意的编辑。
近年来,异军突起的共享单车极大地解决了人们共同面临的“最后一公里”难题,然而,共享单车发展迅猛,自行车道建设却始终没有能够跟上脚步。幸运的是摩拜单车大量的轨迹数据为我们提供了一种新的思路:利用大数据和 AI 技术,使用一种数据驱动的方式更为合理地规划自行车道的建设。
在刚刚结束的 SIGKDD 2017 大会上,微软亚洲研究院城市计算组发表了一篇名为“Planning Bike Lanes based on Sharing Bikes’ Trajectories”的论文,利用摩拜自行车的轨迹大数据解决如今城市自行车道的规划问题,最终形成企业、政府和广大人民群众的三赢局面。
论文地址:https://www.microsoft.com/en-us/research/publication/planning-bike-lanes-based-sharing-bikes-trajectories/
城市计算组
城市计算是一个交叉学科,是计算机科学以城市为背景,跟城市规划、交通、能源、环境、社会学和经济等学科融合的新兴领域。更具体的说,城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战的过程。城市计算将无处不在的感知技术、高效的数据管理和分析算法,以及新颖的可视化技术相结合,致力于提高人们的生活品质、保护环境和促进城市运转效率。城市计算帮助我们理解各种城市现象的本质,甚至预测城市的未来。
以下为城市计算组撰写的详细介绍:
早在上世纪七八十年代,中国曾被称为自行车大国。当时,大多数人的出行都依赖于自行车,以至于自行车成为了中国当时结婚所要求的“三大件”之一。随着经济的快速增长,越来越多的私家汽车进入了普通民众的生活,为大众的出行带来了极大的便利。但随之而来的却是各种城市问题:交通拥堵、空气污染等等。
最近一年,共享单车的出现为人们提供了一种便利的自行车共享方式,用户可以轻松地在任何地方使用智能手机来实现自行车的租借服务。于是自行车重返上路,成为城市用户喜爱的出行方式。以摩拜单车为例,目前它已拥有超过 1 亿注册用户,日订单量约 2500 万。与此同时,政府也非常愿意在群众中推广共享单车的使用。因为共享单车可以降低城市的道路拥堵,减轻空气污染,提高公共交通的使用效率,对人们来说也是更加健康的出行方式。
但是,目前的自行车道建设却没能跟上共享单车所带来的新的骑行需求。如果没有良好的自行车道规划,很多时候骑行的人们只能和机动车一起使用机动车道路,这就使人们的骑行体验大打折扣,并且还可能产生潜在的交通事故。因此,政府希望能够规划出更有效的自行车道来提升大众的骑行体验。
视频地址:https://v.qq.com/iframe/preview.html?vid=h0540z03rnk
从城市角度看,自行车道的规划存在一定的要求和限制: 首先,建设每条专门的自行车道都需要消耗一定的资源,比如政府预算和道路空间等;其次,自行车道作为一种公共资源,政府希望它能够更好地服务更多的人,并覆盖更长的个人骑行轨迹;最后,为了施工和管理的便利,政府更希望这些道路的建设能够在整个路网上连成有限个区域(下图右图),而不是在整个城市中分散的分布(下图左图)。然而,要同时满足这些建设限制要求的规划是一个非常困难的组合优化问题。
幸运的是,摩拜单车的用户在使用过程中记录了非常有价值的轨迹信息,真实地反映了人们的骑行需求,使得我们有机会利用大数据和数据挖掘技术更有效、合理地规划自行车道的建设。
在 KDD 2017 大会上所发表的“Planning Bike Lanes based on Sharing Bikes’ Trajectories ”论文中,我们提出了一个基于贪心思想的近似解法,来实现自行车道规划方案的推荐。该算法包括两个步骤:
基于路网距离的空间聚类;
基于贪心的网络扩展(Greedy Network Expansion)。
在第一步计算中,我们首先根据用户在各条道路上的骑行数据选出 Top-M 条用户骑行最频繁的候选路段,然后利用这些路段之间的距离进行 hierarchical spatial clustering (层次空间聚类,每次我们都合并两个路网距离上最接近的路段聚类,并知道最后的结果只剩下K个聚类)。最后在每个聚类(cluster)中,我们会选择骑行最频繁的路段作为下一步贪心网络扩展的起始点。
在第二步的计算中,每一次我们都将这些起始路段的邻接路段作为候选集合,然后检验每一个候选路段所能够带来的单位长度上所有轨迹分数的提升。接下来,我们每一轮都选择能够给现有方案带来最大提升的路段作为结果,直至预算被使用完(如下图所示)。
通过以下计算方式,每条轨迹都会为新的路段给出一个得分:
其中,segs (τ)表示这条轨迹被我们的建设方案所分成的连续的段数,s.l 表示每一段的长度,而α则是一个调节参数,当该数值越大时,更多的分数就会被给予更连续的规划方案,因为在连续的自行车道上骑行会有更好的体验。比如,相对于下图 a 中不连续的自行车道设计方案,用户更希望在 b 图中设计的自行车道方案上骑行。
利用该算法,我们在上海的摩拜单车数据上做了一系列的实验。比如,想在上海周边 5 个区域内建设 30km 的自行车道,下图就是算法所推荐的一个方案,可以看到算法覆盖了这个区域所有的 6 个地铁站。
为了更好地评估算法所产生的自行车道规划方案的优劣,我们亲自去了上海做了实地调研。在金运路地铁站附近,我们发现除了有规模不小的万达虹桥商场,周围 2 公里内还坐落着许多高密度的居民区。骑行在这个区域内是最方便的出行方式,所以我们在这里看到了密度很高的骑行数据。我们还发现,在这个区域内政府只在主要干道上修建了专门的自行车道(下图中蓝色线道路),我们的算法同样也给出了在这里修建自行车道的建议。
更进一步,我们的算法在那些支路和小区周围的道路上也给出了修建自行车道的建议(上图红色线道路),因为那些道路连接了各个居民区,从数据上也可以看到很多骑行轨迹。但是目前这些地方并没有专门的自行车道,由于各种不规范停车,自行车用户只能在人行道上骑行,或者在机动车道中间骑行,这样的骑行体验自然大打折扣,交通事故的发生也在所难免。
而根据我们系统提出的建议,政府可以在这些支路上修建自行车道,或者先在这些地方增强违章停车的管理,以减少事故发生的可能性,并且提升民众的骑行体验。
该系统得到了上海市政府的高度评价。上海市徐汇区发改委副主任张岚说:“根据人们骑行共享单车的数据分析结论,为政府合理规划自行车道提供了重要的决策参考。”
总的来说,我们在本篇论文中提出了一种更加以数据为驱动的方案,利用大量摩拜单车的轨迹数据为政府推荐自行车道的规划和建设。最终,我们希望能够利用大数据和人工智能这些新兴技术,实现企业、政府和广大人民群众的三方共赢,打造一个更加便利、美好、智能的生活环境!