阿里技术嘉年华-专访江枫:无线客户端大数据实践_最新动态_新闻资讯_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 新闻资讯 > 最新动态 > 阿里技术嘉年华-专访江枫:无线客户端大数据实践

阿里技术嘉年华-专访江枫:无线客户端大数据实践

 2013/7/18 18:00:54    程序员俱乐部  我要评论(0)
  • 摘要:在7月13日的阿里技术嘉年华活动中,来自阿里巴巴无线事业部的高级技术专家宁海元(花名:江枫)给大家分享了“无线客户端大数据实战”(阿里把“移动”称作“无线”)。博客园作为媒体之一,有幸专访了江枫,交流了移动客户端用户行为数据采集、分析方面的话题,下面分享一下我们的采访心得。对于移动App开发者来说,采集并分析用户使用App时的行为数据是改进产品的重要环节,而这将带来3个棘手的问题:1.如何合理地设计采集数据的格式;2
  • 标签:数据 线客户 客户 客户端 技术
class="topic_img" alt=""/>

  在 7 月 13 日的阿里技术嘉年华活动中,来自阿里巴巴无线事业部的高级技术专家宁海元(花名:江枫)给大家分享了“无线客户端大数据实战”(阿里把“移动”称作“无线”)。博客园作为媒体之一,有幸专访了江枫,交流了移动客户端用户行为数据采集、分析方面的话题,下面分享一下我们的采访心得。

  对于移动 App 开发者来说,采集并分析用户使用 App 时的行为数据是改进产品的重要环节,而这将带来 3 个棘手的问题:1. 如何合理地设计采集数据的格式;2. 如何针对不同移动平台在 App 中嵌入采集代码;3. 在服务端如何对这些采集到的大量数据进行统计分析。而江枫负责的无线数据团队就在解决这样的问题,他们先是解决阿里集团内部各种移动 App 产品面临的这个问题,在解决方案成熟至一段阶段之后,将之免费对外开放,于是就有了——淘宝无线数读(http://wdm.taobao.com)。

  移动 App 开发者只需调用对应移动平台的淘宝无线数读 SDK,就可以根据自己的需求进行数据采集,而采集数据的统计分析结果可以在淘宝无线网站上方便地查看到。数据的采集、发送、计算、分析都由淘宝无线数读自动完成,App 开发者无须关心。就像我们在网站访问统计中使用 Google Analytics 一样,在页面中嵌入 js 代码,然后看统计结果。

  这其中面临的最大的技术挑战是大数据的处理。据江枫说,现在每天客户端上传的日志数据量高达 60 亿条。如此巨量的数据的计算工作是由阿里的云梯完成的,云梯简单来说是一个 Hadoop 集群,阿里现在已经实现了跨机房的 Hadoop 集群。阿里能够对外提供这个服务是基于多年在大数据处理方面的经验积累

  专访之后,笔者感触最深的不是阿里在大数据处理上的技术实力,而是这种由内而外的服务产生方式——从解决内部问题的解决方案到对外的公共服务,这代表业界发展的一种趋势:不同 IT 企业之间的重复工作终将发展为一种被大家享用的公共服务。

发表评论
用户名: 匿名