人人为人人推荐”" />
11 月 17 日,第三届世界互联网大会进入第二天。会上,今日头条创始人张一鸣为大家分享了今日头条利用人工智能在内容创作、分发、讨论和审核四个领域取得的成果。
张一鸣表示,截止到 10 月底,今日头条已经累计有 6 亿的激活用户,每天每个用户使用 76 分钟,这个数字在同类产品中名列前三。他认为,这就是人工智能技术在产品上体现出来的优势。“我们没有人维护编辑信息,但是我们的产品使用远超于同行。”
他同时表示,今日头条的人工智能所做的不仅仅是个性化推荐。例如在内容创作领域,一个机器人头条号曾在今年奥运期间累计发布 400 多篇新闻,平均写作时间 2 秒写一篇文章,累计阅读量超过 100 万,点击率甚至超过很多人写的文章。
另外,今日头条在分发方面也提现了“泛化”的特点,“就是并不是你看过这个信息而推荐给你……我们利用人之间共同的特征,把一个结合点利用到其他的人群上。不仅是你为自己推荐内容,而是人人为人人推荐内容。”
以下是演讲实录:
大家上午好!就像小川所说的,实际上人工智能浪潮在中国是非常汹涌的,自从头条采用人工智能推荐信息以来,各家公司包括浏览器、搜索引擎公司等行业都纷纷使用了人工智能推荐信息。
今天前面很多嘉宾分享了很多技术和未来 AI 的应用。我着重跟大家分享一下信息平台智能浪潮,我认为人工智能首先是从信息开始的。在信息平台上也是最容易取得成果的。
开始之前请大家看一段视频,解释一下什么叫智能的信息平台。
这个视频介绍了头条利用我们的信息平台,利用精准的定位技术在新闻上的一个尝试。我们之前比如寻人启示都是放在各报纸的中缝,找到的机会非常少,现在我们已经是中国找人速度最快最多的平台了,每 100 个寻人信息我们能找到 13.75 人,现在已经累计达到 500 人。从这样一个小小的例子可以看出人工智能在信息领域的应用。
很多人问我说今日头条是不是一个媒体?你们公司为什么要招这么多人工智能的工程师?在这儿解释一下,我们是最早把算法、工程、产品结合在一个具体应用上的比较好的公司。我们把算法、工程、产品运营结合,做了一个很好的推荐引擎的应用。我们首先推荐文字、包括资讯和各种问答,也包括图片、视频、直播、寻人等等各种各样的信息。
所以我们更愿意把我们称作一个智能化信息平台。
上个月底,10 月底我们已经累计有 6 亿的激活用户,每天每个用户使用 76 分钟,这个数字按人均时长是占前三名,跟资讯类对比时长至少长一倍,这也体现了 AI 技术在产品上的体现。我们没有人维护编辑信息,但是我们的产品使用远超于同行。
很多人说你们是一个个性化推荐引擎,其实人工智能不仅用在个性化推荐方面,它至少包括四个领域的应用。内容的创作、分发、讨论和审核。
依次展开:图上是我们的一个头条号,它的作者不是一个人,是一段程序,是一个机器人。在奥运期间这个机器人累计发了 400 多篇新闻,平均写作时间 2 秒写一篇文章。累计阅读量超过 100 万,点击率甚至超过很多人写的文章。在奥运期间也有报道,应该是《华尔街日报》和今日头条都推出了机器人写作,但是我们机器人写作不是仅仅的把一些文字和数字填充到模板上,它还会列图片,机器人会从图库中选择适合这篇报道的图片。我们可以想像机器在财经、气象等等领域都可以出现机器创作,因为机器能够最快、最准确。相对标准化、适时化的内容是很有可能让机器替代创作的,这是很好的案例,就是机器、人工智能介入创作。
再看分发:头条在把人工智能用在分发市场,业界都比较了解,业界可能认为我们仅仅是个性化推荐。举一个例子,这个屏幕,是我去年去波士顿遇到一个哈佛的学生,他跟我说,为什么我在波士顿能看到长沙的新闻,虽然我是个长沙人,机器怎么知道的?我说你在过去两三年的春节有没有回家呢?他说回家了,我说大概率是因为我们的机器猜到你春节回家,你很可能是长沙人。他说我看不到很多长沙人,长沙市政府引进人才的新闻我却能看到,我说确实我们不会因为你是长沙人就把长沙所有新闻推荐给你,我们现在只是把在长沙的留学人才可能喜欢看的新闻推荐给你。他问我说,你怎么知道长沙出国留学的人才喜欢看这条新闻呢?我们告诉他,并不是因为你看了这条新闻,是因为很多类似你这样的长沙出国的留学人我们给他们推荐这样的新闻点击率比较高,所以你跟他们类似。
其次就是它体现了泛化,就是并不是你看过这个信息而推荐给你,他并没有看到这块长沙吸引高端人才回流的信息,而是跟他类似的人看到了,我们利用人之间共同的特征,把一个结合点利用到其他的人群上。不仅是你为自己推荐内容,而是人人为人人推荐内容。
第一是数据积累。我们发现推荐系统具备这样的一个特点,第一它是一个人用,一个人用的越久越好用,知道你越多的数据,这是个性化。
第二越多人你也越好用,因为越多人用越多能找到跟你类似的人群。
第三越多人用久这个产品越好用,因为这是数据的积累,因为机器人像人的大脑一样,给它越多的输入越有更多的数据积累。
目前我们有 800 个算法工程师,2 万台服务器,150 亿条新闻样本,每天新闻请求 60 亿次。除了创作分发,在互动上人工智能也是参与非常多的。我们经常问一个问题,我经常会问一个问题,但是我不知道谁能回答这个问题,我们可能会在朋友圈问一下,恰好有人回答的。但是我们怎么做呢?我们是分析你的问题代表的领域,我们在所有的用户中找到这个领域感兴趣的人,这个领域的专家,这个人看过这个领域很多文章。我们将把你的问题推荐给可能的回答者,我们判断他有可能回答出高质量的答案,把问题推荐给他。他回答了以后,我们再判断有什么人对这个答案感兴趣,我们帮这个答案找到读者。我们叫作“你提问题、系统匹配、读者来阅读”。所以提问、回答、阅读这个匹配过程也是可以让机器发挥非常重要的作用。因为很可能你感兴趣的问题,可能的答题人是跟你相距很远的,我们不仅用问答的匹配,我们也尝试一些结构化信息内容机器直接算出答案,这就是基于计算的自动问答。
审核方面:目前互联网信息爆炸有非常多的内容产生,很多内容也是良莠不齐,我们希望把不符合法律法规和不符合社会道德标准的内容剔除掉,这些内容人看的话效率非常低。如果现在头条的内容一个人看需要 150 天才能看完,我们测算过,两个人看他们之间相似准确率只有 75%,但是机器判断可以准确率达到 85%,25 分钟完成。因为机器可以快速的找出相似的部分和不同的部分。所以人工智能不仅可以用在信息的推荐,也可以用于信息审核。
头条是中国原创但是全球领先、人工智能在信息领域应用的平台。我们现在也在努力的把这样一项技术,这样一项产品推向全世界。
谢谢大家!