刚刚组建完“达摩院”的阿里巴巴,也要进军无人驾驶领域了吗?
1 月 14 日,澎湃新闻记者发现,阿里巴巴首次出现在国际最大的自动驾驶计算机视觉算法集 KITTI 道路场景分割排行榜上。
榜单显示,阿里人工智能团队 iDST 获得三项分割任务第一,包括 UU_ROAD(乡村车道)与 UMM_ROAD(多车道)两项特定场景任务,及整体场景的综合评测任务 URBAN_ROAD(城市车道)。
阿里巴巴方面向澎湃新闻证实了这一消息,不过否认阿里将进军自动驾驶业务。
阿里方面表示,该公司重视基础科学研究,自动驾驶技术是其中一部分,该项研究正由阿里巴巴机器视觉科学家任小枫率领。
据了解,KITTI 数据集是自动驾驶技术研发必选的调测平台,图森、宇视、三星、日本电气(NEC)等公司都曾出现在排行榜上。
资料显示,KITTI 数据集由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是国际公认的最大自动驾驶计算机算法评测数据集。
KITTI 数据集涵盖城市、住宅区、道路、校园、行人等五大场景,采用更适合自动驾驶的 BEV(Bird's?Eye View,鸟瞰)视角评价方式,包含众多难度较大的无标识线道路。
从 KITTI 官网来看,这项评测数据集主要分为场景分割、目标检测、目标跟踪等大类。一位研究人员告诉澎湃新闻,其中道路场景分割在自动驾驶领域至关重要,主要应用在自动驾驶中的可行驶区域划分、自动驾驶路径规划、高精地图构建以及辅助驾驶的 AR(增强现实)导航。
阿里获三项分割任务第一。来源:KITTI 官网截图
大多数自动驾驶研究机构都能做到对城市道路的大块分割,但对于边缘路面,例如石头、车辆沿路停靠等还存在很大识别难度。如何把道路边缘分割得更为精细,是目前道路场景分割的主要攻坚方向。
阿里巴巴的一份声明称,由任小枫带领的阿里 iDST 视觉技术团队提出基于在线难样本挖掘的网络学习方法,同时在网络中增加在线数据增强模块,及全局特征、局部特征融合机制,提升网络特征的表征能力与推广能力,以解决道路分割问题中的道路边沿与车辆周围路面分割不准确、阴影干扰等问题。
经过半年时间研究,阿里以 96.06%、97.70% 的分割准确率分别获得 UU_ROAD(乡村车道)、UMM_ROAD(多车道)两项特定场景评测任务第一,96.76% 的准确率获整个道路场景分割综合评测任务 URBAN_ROAD 第一。这也是阿里巴巴首次出现在 KITTI 道路场景分割的排行榜上。
2017 年 6 月,澎湃新闻率先报道了亚马逊最高级别华人科学家任小枫入职阿里 iDST 团队的消息。任小枫曾主导亚马逊 Amazon Go 无人店算法,在他入职阿里时,曾被赞在图像领域的专家中非常难得:“在计算机视觉领域中对图像分类,物体识别、跟踪、检测,事件检测均有全面且深入的理解。”
记者同样发现,在 KITTI 数据集的其他几个项目中也看到了阿里巴巴 iDST,包括车辆检测、行人检测与行人再识别部分。据介绍,这部分技术已经在阿里云 ET 城市大脑的场景中落地,目前主要用于城市交通管理。
阿里巴巴的科研能力正在崛起,且强调对基础科学的研究投入。在 2017 年的杭州云栖大会上,阿里宣布成立探索人类科技未来的实验室“达摩院”,计划在三年内对新技术投资超过 1000 亿人民币,用于涵盖基础科学和颠覆式技术创新的研究。阿里巴巴董事局主席马云希望将“达摩院”作为阿里巴巴留给世界最好的东西之一。