互联网每天产生数以百万计的信息,这其中充斥着太多的“垃圾”信息,这些东西只会干扰视线、浪费时间。从本质上讲,内容本身并无好坏之分,在你看来是垃圾的信息,有时对某些人来说却很有用,内容永远只有感兴趣和不感兴趣两种。
在这种情况下,基于大数据的个性化推荐仿佛就是一种颇为行之有效的方法了。借助强大的数据采集、分类和提取技术,根据以往的数据为我这个服务对象赋予各种“关键词”,然后再针对这些关键词为我推荐内容。随着阅读的时间越长,系统越了解我,推荐的内容就越精准。
拿国内在个性化推荐方面做的比较不错的“今日头条”来说吧,首先系统的采集海量的信息,然后通过数据挖掘,智能分析出每时每刻最热门最值得用户关注的资讯,再基于微博分析出用户以前获取信息的情况,建立起个人用户模型,两者结合,就能智能的为用户推荐个性化的信息了。但是这些内容真的就是我们感兴趣的内容吗?我打个大大的问号。
一、无法感知兴趣之外,只会让我们越来越狭隘
首先说说,我为什么在使用了今日头条接近一个月后愤而卸载的原因吧。前段时间,关于文章和马伊琍的婚变事件,成为互联网新闻的大热门。今日头条连续向我推送了多条 push 提醒,当然这些消息确实是我感兴趣的,所以大都点击了。在这之后,个性化推荐给我的就全部是各类娱乐八卦新闻了。我使用这款软件,主要目的还是为了了解当天发生的热门事件,至于个性化对我来说并不是很重要,每天自己去收藏的各大网站看一遍,基本上已经满足我的阅读需求了。但现在满屏幕的娱乐八卦,对我来说有点信息负载了。我喜欢八卦,但不是只生存在八卦的世界中。
个性化推荐貌似很懂我,能够精准的猜测出我最喜欢阅读的内容,且不说这种做法是否足够科学、其背后的评价机制是否有效,就算它科学有效,这是不是意味着“我只喜欢看同一类内容”呢?倘若我们一直接收的都是符合喜好的内容,则很有可能陷入危险境地。这种推荐看似人性化,实则在阉割新闻。用户生活在自我的世界,无法感知兴趣之外的“新”事物。而无法接触“新”事物自然就不能培养新的兴趣。个性化新闻体验采集自你的兴趣,又决定了你的兴趣。用户最终沦为井底之蛙。新闻除了让人感知世界外,还能启迪思想。我最担心的是,个性化新闻体验让思想裹足不前。
二、机器系统,永远无法感知我们为什么需要阅读
今日头条每次刷新会向我推荐 15 篇文章,其中大概 2 篇内容是我喜欢的,再加上一些当天最热门的文章,某种程度推荐的并不是很精准。用户刷新信息流的成本非常低,某种程度和微博比较类似,只不过内容更多更丰富。但对具体用户来说,大量并不精准的推荐造成的体验其实并不好。这可能和他们基础数据收集的不够有关系,但即使未来精准了,这也无法解决随场景变化而产生的阅读需求变化。其实有时候很可笑的是,在某一个阶段,我们因为大家都在讨论某件事而去关注这件事,但这并不意味着我们对类似的事情都感兴趣。
在我看来推荐这事跟一个人在某一领域的深入程度有关,对于一个青春期没见过世面的骚年来说,这世界上一切 AV 大抵美好,而对于一个千片阅尽喜欢有剧情色调明快偏好身材娇小匀称轮廓柔和喜欢被凌辱但讨厌伤害的死m宅男来说,推荐则是几乎不可能完成的任务。这不只是找出如此细分程度的内容的问题,还有你如何发现如此细分的需求的问题,还有他对以上标签不同的唤起程度以及对其他非最佳标签的宽容程度的问题,最关键的,我们不是要知道他已知的需求,而是要探究他未知的喜好,这才是整个问题里最无解的一环,所谓人心难测,正在于此。机器永远都无法感知,我们为什么在某个时刻喜欢阅读某类内容。
三、更精准的推荐,往往带来的是内容垃圾化
说出这个判断,其实可能会惹来争议,但基于大数据挖掘的个性化推荐,首先最根本的核心是大数据。如何能够拥有大数据,这需要系统收集海量的数据,而这些海量的数据中本身就包含大量的垃圾信息。再拿我喜欢看娱乐八卦这件事情来说,我喜欢看的八卦只是极个别的那少数的明星,剩下的那些明星并不是我关注的对象。
今日头条确实能够精准的分析出我喜欢娱乐八卦,给我推荐的新闻也确实都是娱乐新闻,但这些内容却并不是我想要的。此外还存在热门文章过度推荐问题,这导致个性化程度很差。退一万步讲,就算推荐的都是我感兴趣的话题,内容质量上也不是很好。新浪娱乐和一个不知名的娱乐小站是提供相同主题的内容,但对我来说他们的价值却是天差地别。我只想看到的我感兴趣的那些优质内容,你却给我带来如此多的嘈杂声音。
随着微博这种短消息机制的流行,网络上的文字越来越短,人们也越来越没耐心阅读长篇大论,当然也不是所有人都喜欢“短、平、快”的信息分发方式。我们的阅读需求每时每刻都在变化,有时候觉得累了就看短消息,快速过一遍;有时候觉得需要充电,所以想看深度的文章,了解一件事的来龙去脉,这要求阅读产品拥有足够的弹性。
新闻确实存在信息的过载,但是大部分人看新闻的主要方式是热门新闻+自己关注板块的今天发生的新闻+一些新颖度较高的原来未关注的类型的新闻,所以其实热门新闻和相关板块每天发生新闻就足够了。其实每天我们都在帮助自己做个性化的筛选,可能今日头条能够覆盖到我们平时覆盖不到的内容,但我们的时间本来就是有限的,你推荐的大量新闻,我们有时间可以看吗?
四、缺乏人的因素,个性化根本无法谈起
我们不管前面所说的所有关于今日头条的缺点,它最大的问题还是缺乏人的因素。在我看来只有把基于算法的内容推荐和基于社会化关系的推荐结合起来,才能真正实现个性化。比如我看某一个 google glass 科技新闻,它无法跨域把 twitter 里面的有 google 工程师参与该项目的人及其技术分享推荐到我面前
这也是我认为微博不可替代的原因所在。今日头条平台上提供的都是各类新闻资讯,它永远无法捕捉到最细微的人的情感变化。一条短短的 140 字的微博,也许就能触发我们的情感,引发我们心灵深处某种灵魂触动,我们知道我们关注的一个个微博账号都是一个活生生的人。我们因为赞同某人,喜欢某人的思想,从而实现了个性化的自我价值提升,而今日头条上却缺乏这些。
人人都是自媒体的时代,即使再渺小的个体都可能成为一个新闻源,以前的媒体是传播节点,现在变成的具体的个人。今日头条因为没有收录这些内容,很可能造成一种情况,我们的信息流动速度严重滞后于他人。我们无法感知新闻事件背后人们情绪的变化,而这恰恰是我们为什么要阅读某类新闻的原因所在。人们基于彼此的共性,彼此对同样感兴趣的内容进行推荐和讨论,我们称为「社交」。目前看来,现有「个性化阅读」的产品,想要解决的问题,豆瓣和新浪微博之类已经解决的很好。这些产品天然的社交推荐机制,要比各种产品的「推送」来得更加准确、合理。
五、兴趣不是死物,个性化永远需要面对的困境
用户做什么比说什么更真实地反映了他的意图,但从目的上讲,互联网产品根据用户的实际行为来进行自我调整,与传统媒体根据用户纸笔写下的意见来进行自我调整,并无二致:都是为了让用户更多地看到他感兴趣的内容,更少看到他不感兴趣的内容。但兴趣并非静态的死物,兴趣的扩充是保持一个人精神活力的前提。我们说互联网是革命性的,恰恰就因为它降低了扩充兴趣和视野的成本。
个性化应该是我们已知以外的某种补充,但现在它恰好无法胜任这种补充身份。或许有一天我们可以做到,但现在,无论是基础数据量还是算法,只能让我感觉这是一个不甚好笑的笑话。我姑且相信在做这件事的诸位做的是一件有意义的事情,我只是不相信这件事现在对我有意义而已。相对于“个性化”,我更关心相同/相近信息过滤,我觉得这才是一个更急迫也更好解决的问题。