许多人可能并不了解 Google 学术搜索,但是,对于学者、律师,还有学生群体来说,Google 学术搜索是非常重要的网络服务。在那里,他们可以找到关键的信息,同时,也可以把自己的研究分享给真正需要的人。
在 Google 学术搜索诞生十周年之际,著名的科技作者 Steven Levy 采访了该项目的关键创始人 Anurag Acharya,回顾了它发展中的一些故事。
Anurag Acharya 于 2000 年加入 Google。在很长一段时间里,他一直负责 Google 的网络检索技术。为此,他需要与网站管理员、出版商、企业、政府等打交道,同时,他还负责检索的更新。这是一项压力很大的工作,让他感到身心俱疲。“或者是离开公司,或者是做些自己感兴趣的、压力较小的工作。” 他回顾说。
于是,他得到了准许,与另一位工程师 Alex Verstak 合作,创建了免费而开放的服务:Google 学术搜索。在经过一些测试后,他们把产品展示给佩奇。佩奇的反应是,“这个为什么还不上线?” 于是,在 2004 年 11 月 18 日,学术搜索正式上线了。
在学术搜索上线后,Acharya 和团队努力去说服学术著作出版商,以获得他们的允许,检索他们的学术期刊。由于许多文章都是要付费的,用户搜索到了,也不一定能够阅读,但是,就算是仅知道这些学术作品的存在,有时也会有很大的意义。同时,Google 还与出版商谈判,希望他们允许用户看到学术作品的摘要。他们说服了全球最大的在线期刊库 JSTOR,让他们向用户提供学术作品第一页的扫描。“通常来说,第一页上有摘要,在旧的学术作品上,你会看到一篇介绍,” Acharya 说,“这至少能让你有个大概了解,从而决定是否还需要去努力。”
多年来,Acharya 和团队不断与出版商打交道,改善产品,将其推向新的领域。Google 学术搜索的一个创新是,它能够正确辨识出特定的作者。“学术界有许多作者的名字是‘Jay Smith’,” 他说。为了解决这个问题,Google 首先对作品进行判断,把可能是同一人的作品聚集起来,然后,让真正的作者来辨认。这看起来是很不 Google 的办法。但是,Archarya 说,“这个问题无法通过完全自动化来解决,因此,我们给了你一些作品合集,然后你说,‘这些是我的作品’。这就行啦。剩下的事情是自动化的。”
在 Larry Page 的精简政策中,Google 学术搜索没有被抛弃,不过,它隐藏更深了。对此,Archarya 说,低调不是问题。那些使用 Google 搜索的人,仍然会很快地找到它。同时,他也表示,产品的使用量没有减少,而公司也没有削减投入。因此,他不担忧 Google 学术搜索的发展,而且乐意继续从事这项工作。
图片来自 backchannel