算法内容真实性成重要标准" />
3 月 4 日,谷歌当前正考虑通过网站内容的真实性对网站进行排名。业内内容越真实,网站在搜索结果的排名中也将会越高。
谷歌当前提供的搜索结果,依据一系列算法而得出,包括导向网站的链接数量、用户花费在网站上的时间、以及它社交媒体概况的重要性等等。谷歌这套由联合创始人拉里·佩奇(Larry Page)开发出的名为网页排名(PageRank)的算法,应该是基于网站的声誉对网站进行排名。
不过谷歌内部一支技术人员和研究科学家团队认为,当前的系统仅仅反映出的是网站的流行程度,可能没有怎么告知用户内容是否真实。该团队表示,八卦网站就是一个极好的例子。虽然八卦网站非常流行,但是它们通常都不会去考虑内容的真实性。
为解决这一问题,谷歌已开始开发新的“寻找真相算法”(truth-seeking algorithm)。国际性科学杂志《新科学人》(New Scientist)率先报道了谷歌的这一新算法。
“寻找真相算法”如何工作?这一新算法利用了谷歌知识库“Knowledge Vault”。该知识库从互联网上收集了 28 亿多份事实真相。
通过对比数据库检索页面,以及交叉引用相关事实,该团队认为这种算法能够以真实分数分配每一个页面。拥有高比例虚假内容的页面,在搜索结果中的排名将会大幅下滑。
谷歌已经表示,这一新算法目前仍处于研究阶段。在最终被应用之前,科学家们仍需要解决大量的问题,包括确保适当的处理基于一个话题的新事实。