基于人工智能的新型搜索引擎是科学研究的“游戏规则改变者”

语义学者和微软学术等产品可能是学者的福音

一个免费的基于人工智能的学术搜索引擎旨在超越谷歌学术,其创建者于 11 月 11 日宣布,该搜索引擎正在扩展其论文库,涵盖计算机科学和神经科学领域的约 1000 万篇研究文章。自去年推出以来,它已经加入了其他几个基于人工智能的学术搜索引擎,最值得注意的是计算巨头微软重新推出的产品。

来自华盛顿州西雅图非营利组织艾伦人工智能研究所 (AI2) 的语义学者在圣地亚哥举行的神经科学学会年会上公布了其新格式。一些提前预览该网站的科学家印象深刻。“这是一个游戏规则改变者,”加利福尼亚州斯坦福大学的神经生物学家安德鲁·休伯曼说。“它引导你穿过原本相当密集的信息丛林。”

该搜索引擎于 2015 年 11 月首次推出,承诺使用对其内容和上下文更复杂的理解来排序和排列学术论文。流行的谷歌学术可以访问约 2 亿份文档,并且可以扫描付费墙后的文章,但它仅通过关键词进行搜索。相比之下,语义学者可以例如评估对一篇论文最有意义的引用,并按引用上升的速度对论文进行排名——衡量它们有多“热门”。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。


首次推出时,语义学者仅限于计算机科学领域的 300 万篇论文。部分由于与 AI2 的姊妹组织艾伦脑科学研究所的合作,该网站现在增加了数百万篇论文和专门针对神经病学和医学的新过滤器;这些过滤器可以实现基于例如论文研究的大脑部分或细胞类型、研究的模型生物以及使用的方法论进行搜索。首席执行官奥伦·埃齐奥尼说,明年,AI2 的目标是将 PubMed 的所有内容编入索引,并扩展到所有医学科学领域。

“我仍然最常用的是谷歌学术,”在马德里为软件公司 Expert System 从事语义搜索工作的何塞·曼努埃尔·戈麦斯-佩雷斯说。“但是这里有很多潜力。”

微软的复兴

语义学者并不是唯一基于人工智能的搜索引擎。计算巨头微软悄然发布了自己的 AI 学术搜索工具微软学术,于今年 5 月向公众开放,取代了其前身微软学术搜索,该公司于 2012 年停止对其进行添加。

微软的学术搜索算法和数据可通过应用程序编程接口 (API) 和开放学术协会(微软研究院、AI2 和其他机构之间的合作伙伴关系)供研究人员使用。“参与这项工作的人越多越好,”负责微软工作的王冠三说。他说,语义学者正在更深入地研究自然语言处理——即理解论文和查询中完整句子的含义——但微软的工具由该公司网络搜索引擎必应的语义搜索功能驱动,覆盖范围更广,拥有 1.6 亿份出版物。

与语义学者一样,微软学术提供了有用的(如果范围较小)过滤器,包括按作者、期刊或研究领域进行过滤。它还汇编了每个子学科中最有影响力的科学家的排行榜。这些人是在该领域发表“重要”出版物最多的人,由递归算法(免费提供)判断,如果论文被其他重要论文引用,则该论文被判断为重要。根据微软学术,过去六个月中最顶尖的神经科学家是明尼苏达州罗切斯特市梅奥诊所的克利福德·杰克。

其他学者表示,他们对微软的努力印象深刻。英国米德尔塞克斯大学研究科学指标的安妮-威尔·哈尔津说,该搜索引擎正接近于结合谷歌学术的大规模范围与 Scopus 和 Web of Science 等订阅书目数据库的更结构化的结果,并且分析了新产品。“微软学术凤凰无疑正在展翅,”她说。微软研究院表示,它正在开发一个可个性化的版本——用户可以登录,以便微软可以将适用的新论文引起他们的注意,或通知他们对其自己作品的引用——预计在明年初推出。

其他公司和学术机构也在开发人工智能驱动的软件,以更深入地挖掘在线发现的内容。例如,位于德国萨尔布吕肯的马克斯·普朗克信息学研究所正在为健康和生命科学领域专门开发一个名为 DeepLife 的引擎。“这些是研究原型,而不是可持续的长期努力,”埃齐奥尼说。

从长远来看,AI2 的目标是创建一个可以回答科学问题、提出新的实验设计或提出有用的假设的系统。“在 20 年后,人工智能将能够阅读——更重要的是,理解——科学文本,”埃齐奥尼说。

本文经许可转载,并于2016 年 11 月 11 日首次发布

尼古拉·琼斯是 Knowable Magazine 的特约编辑和作家,居住在不列颠哥伦比亚省彭伯顿。在她自己的博客上阅读更多关于她和她的作品的信息。

更多作者:尼古拉·琼斯

《自然》于 1869 年首次出版,是世界领先的综合性科学期刊。《自然》发表最优秀的同行评审研究,这些研究推动了突破性的发现,并被世界各地的思想领袖和决策者阅读。

更多作者:自然杂志
© . All rights reserved.