今天是 5 月 11 号。在v.kuaidadi.com 这一公开页面,你可以看到 5 月 10 号的全国出行数据:昨天打车需求量最大的三个城市是北京、上海和杭州;沈阳人出门打车最早;夜生活最丰富的城市是杭州(也许是加班生活);打车费最高、最土豪的城市是上海(单行线比较多)……
而将这些数据直观呈现出来的,是中国版图上那些闪烁的小三角、小圆圈,以明暗度和圆圈大小区别打车难易、被抢单时间长短。闪烁频率间隔是一小时,同时预测未来一天的情况。
这是滴滴快的的智能出行平台。与我们顶多在这页面过把上帝视角的瘾不同,滴滴快的技术人员能够用这个平台做很多事情,比如通过历史数据,可以预测出在一定范围内,哪个点的需求量比较高,哪个点跑远途的概率最多,客单价多少等。这样一来,司机就不用纯靠经验判断,而是可以利用大数据选择于自己最有利的工作方式。以前跑 12 个小时才能挣到的钱,现在则用不了那么久了。
从更大的层面来讲,滴滴快的能够依据平台上车辆的迁徙轨迹、流向为政府的交通规划给出建议。比如从前政府在修路前并无太大预见性,可能就是在车流量过大的道路后边再开一条路。但事实上,一个地方车流量大可能与其周边设施有关,这时候,滴滴快的智能出行平台就可以根据人群的迁徙情况帮助政府做调控,此外,它还能对老城区的优化问题有所助益。
而这些之所以能实现,有赖于滴滴快的沉淀下来的数据。滴滴快的在今年 2 月份合并后,两家的后台正在逐步打通,之前积累的数据也在进行重新梳理。上述提到的这个智能出行平台,正是两家借着合并的契机推出的新系统,有了新系统,便能进行技术的深层积累。
在这之前,该说说出行大数据要解决的最本质、也是最基础的问题:供需匹配。以前在互联网出现之前,乘客都是在路边等。现在互联网出现了,我们暂可将供需匹配理解为双方的排兵布阵。最简单的逻辑应该是,乘客站在一个点,发出用车需求,直线距离最近的车接单。但事实往往不是如此,直线距离最近的点往往隔了立交桥,或是一条河。
因此供需匹配要引入维度更多的数据挖掘算法,做匹配的时候要考虑实际的路径、司机车头朝向、谁过来最快,需要掉头的话是不是方便掉头等。而这些因素会让问题的复杂度以几何级增长。另外,由于中国目前处于高速发展期,地图基础信息不够,出现定位不准的问题几乎是家常便饭。滴滴快的要想服务好用户,就需要自己采集数据。有两种方法,一种是通过地图采集团队,但滴滴快的毕竟不比 BAT 大公司的体量,采用这种笨方法并不占优势。另一种就是利用技术手段了,比如滴滴员工从他们的总部得实大厦发起订单,地图总是会定位到十字路口,假设有 20 个用户的订单发起地都是得实大厦,那么滴滴快的就会用技术手段对其校正。
定位好说,可以自己校正。至于转向掉头的问题,滴滴快的使用的是地图上提供的数据,因为路网数据采集起来难度要高得多。为了尽可能提高精确度,滴滴快的会对导航进行优化,因为对滴滴快的来说,导航至关重要的地方在于告诉司机怎么接到乘客。怎么做呢?通过 UGC。比如从机场到望京这段路,滴滴快的会整合出出租车司机经常走的路线,从而找出最佳路径。
以上是滴滴快的此前正在做的事,而在这个智能出行平台推出后,滴滴快的将进入“数据采集的 3.0 时代”。
比如进行点击日志收集和用户行为收集。用户在打开一个 App 后,有的人会先去查看优惠券情况,有的人会直接去打车,这反映了不同的用户诉求和不同使用场景。通过收集这些数据,用户画像会全面丰满许多。
这就形成了可以将数据变现的商业模式。刨开隐私问题,滴滴快的这样的出行平台可以定位到一个人的住址、消费能力、日常生活情况。想象下,你周末下午两点去西单,滴滴快的可以立刻识别出你是什么样的人,消费档次如何,去西单哪类商店购物的可能性最大。然后,滴滴快的就可以将相应商家的优惠券推送给你,它从中收取提成。再或者,滴滴快的后台在晚上十点会出现一个明显的迁徙图,从西二旗到龙泽回龙观,那么滴滴快的则可以取得这些人精准的作息时间、住址,再倒推到房、车、收入。这些人什么时候换车、什么时候换房,滴滴快的可以联合宝马奔驰 SOHO 万达把这些买卖全包了。
有兴趣的各位不妨去探索下它能如何为你所用。