天弘基金近期推出的《余额宝一周年大数据报告》里,余额宝的用户特征,年龄、客单量、地域、使用习惯、交易频率、交易时间等真实的信息首次被披露。
余额宝海量样本已超过 1 亿用户,换句话说,中国每 13 个人中就有一个余额宝用户,这比一般“抽样调查”更具“全样本”性,是真正的“大数据”。
而这样的客户数量也使天弘增利宝货币基金已成为世界上客户数最多的货币基金,并成为世界第 4 大货币基金。截至 5 月 26 日,余额宝规模达 5742 亿元,运行一周年共为宝粉创收 118 亿元。
前述报告显示,余额宝用户人均持有余额宝 5030 元、人均年龄 29 岁;80 后、90 后占比 76%。人数占 43.82% 的 80 后,持有余额宝金额达 49.76%,贡献余额宝近半壁江山;18~22 岁的大学生年龄段占比高达 20%。
80 后还是绝对的“高频交易者”,在余额宝全年 4.96 亿次转入、8.10 亿次消费和提现中,80 后的转入、转出笔数均过半。不过余额宝也并非年轻人的专利,3.8% 的宝粉超 50 岁。
此外,余额宝上线之初,男、女有效用户数占比差距很大,达 21.8 个百分点,但随着时间的推移渐渐缩小,直到双十一,这种差距缩短为 5.9 个百分点,逼近全国人口男女比例,此后长期趋于稳定状态。
在 31 省区市中,绝大多数省份男性持有金额高于女性或者相当,只有浙江、上海和黑龙江三地,女性持有金额高于男性,且女性用户数也超过男性。
天弘基金大数据中心主管周卫国告诉 21 世纪经济报道记者,天弘基金大数据中心有百亿级以上的数据处理能力。截至 5 月 26 日,余额宝基础数据有 53 亿条,基础数据维度 15 个。
而这 15 个维护又包含各种交叉分析,比如地域和年龄的交叉分析,还有些涉及许多复杂的模型,因此基础数据达到 96 亿条,数据维度 35 个。比如对“客户流失”的分析,除看简单的客户转出金额、转出次数、周/月度行为规律、提现和消费占比等基础数据,天弘还专门建立了一个客户流失 LOGIT 模型,单这一个模型便使用 17 个指标变量,包含 1 个目标变量和 16 个候选输入变量,使用数据有效记录数 9.6 亿个。