本文发表于《大众科学》的前博客网络,反映的是作者的观点,不一定代表《大众科学》的观点
这次(不,我还没有变成只做采访。再做一次采访,我们就回到正常发帖)我采访了 Victor Henning 博士。Henning 博士拥有德国魏玛包豪斯大学心理学博士学位,并且是 Mendeley 的联合创始人兼首席执行官,Mendeley 是一个允许管理和共享研究文章的程序。Mendeley 成立于 2007 年底,现已拥有 200 万用户(并发布了一份有趣的全球研究报告,其中包含按学科划分的活动、每位研究人员收集的平均文章数量等图表)。
您在 2007 年与 Jan Reichelt 和 Paul Föckler 共同创立了 Mendeley。 您当时对 Mendeley 的愿景是什么?从那时起它是否发生了变化?
当我们开始做 Mendeley 时,我们主要是想解决自己的问题:我们都是博士生,每个人都有数百篇 PDF 格式的研究论文需要管理。我们想知道为什么没有更简单的方法来管理这些 PDF,并将其与书目参考文献链接起来,以便在您撰写论文时创建引文。这是 Mendeley 背后的第一个关键想法:让我们开发一个桌面应用程序,它可以自动将我松散的 PDF 集合变成一个结构化的研究论文数据库,我可以阅读、注释、引用并与他人共享。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将帮助确保有关塑造当今世界的发现和想法的有影响力的故事的未来。
第二个关键想法是:如果我们能让数十万研究人员使用这个桌面应用程序自动从研究论文中提取信息,为什么不将所有这些数据众包到一个匿名的开放数据库中呢?我们意识到,如果数据从全球各地的研究人员实时流进来,我们将能够分析跨学科的研究趋势,将具有相似兴趣的研究人员联系起来,显示单个研究论文的读者统计数据,并生成类似于亚马逊的协同过滤推荐,即“阅读过研究论文 A 的人也阅读过研究论文 B”。
这是我们从一开始就有的愿景,而且从那时起并没有发生重大变化。最大的变化可能是,我们最初非常专注于创建研究连接的可视化 - 例如,您可以在 Mendeley 桌面应用程序中将您的研究论文集中包含的引文网络可视化为 3D 地图。后来,我们放弃了这一点,因为它本身就是一项艰巨的任务,而且我们意识到,如果我们的社区想要,我们可以让他们自己构建可视化工具。因此,我们的愿景转向使第三方开发人员能够免费地利用我们的众包数据(在 Creative Commons“CC-by”许可下)来构建他们自己的应用程序。自从我们发布开放 API (http://dev.mendeley.com) 以来,已经构建了 260 多个第三方研究应用程序——可视化工具、协作应用程序、语义注释工具、原始基因组数据混合、专家查找器服务、Kindle 和 Android 应用程序、搜索界面,应有尽有。我们的愿景现在集中于将 Mendeley 转变为一个让这个生态系统蓬勃发展的平台。
新的 Mendeley 报告显示,Mendeley 用户中最大的群体 (31%) 来自生物学和医学学科。这是因为您针对这些学科,还是因为它们在全球科学市场中占主导地位,还是有其他原因?
我们开始时讨论过是否要针对特定学科,但最终决定不这样做,因为我们认为 Mendeley 桌面对于任何试图管理学术知识的人(包括科学和人文科学)都很有用。我相信,Mendeley 用户群的人口统计数据可能很能代表整体研究人口统计数据:生物学家和医生的数量显然比语言学家和哲学家的数量要多得多。
不过,我们确实首先针对了特定的地理区域。因为我们三位 Mendeley 创始人都是德国人,所以我们的个人学术网络也主要是德国的。我们想避免给美国和英国的学者留下 Mendeley 是德国网络的印象,所以我们在首先邀请我们的朋友时非常谨慎。相反,当它推出时,我沿着美国东海岸进行了一次巡回演讲,并在普林斯顿大学、纽约大学、耶鲁大学、布朗大学、麻省理工学院、哈佛大学和达特茅斯学院等地方展示了 Mendeley——它真的从那里开始流行起来。
Mendeley 现在有一个机构版本。它的主要功能是什么?它对学术机构的价值是什么?
更详细地说:订阅 Mendeley 机构版 (MIE) 的机构可以将其所有学生和教职员工升级到 Mendeley 高级帐户,这意味着他们可以获得更多的云存储/同步空间、个性化研究推荐、增强的组功能和高级支持。数据仪表板跟踪机构的教职员工和学生阅读最多的期刊,使他们的图书馆能够优化其订阅——这意味着,他们可以取消不使用的期刊,并订阅受欢迎但图书馆尚未提供的期刊。这使图书馆员能够从日益稀缺的资源中榨取更多价值,并为他们的研究人员提供更好的服务。
此外,MIE 数据仪表板还会跟踪教职员工的出版物:他们在哪种期刊上发表文章,以及这些出版物的影响力(以全球读者人数衡量)有多大?这有助于机构收集用于研究卓越评估和其他报告的信息,并向他们突出显示他们当前和未来的明星研究人员。
最后,MIE 包含一个“社交”选项卡,该选项卡向图书馆员显示其教职员工最活跃的公共组。然后,学科图书馆员可以加入讨论,重新与他们的选区建立联系,并帮助他们发现相关的研究内容。他们还可以为他们机构的所有研究人员设置 OpenURL 图书馆解析器,以确保他们一旦在 Mendeley 上发现有趣的引文,就可以完全访问其图书馆已付费的内容。
您的影响力指数(在机构版本中)是衡量文章影响力的一种新方法。您是否听说过它被用于机构决策的任何案例?您认为该指数反映了什么?
MIE 仍然很年轻——我们只是在本秋季学期才开始在校园里推广它——所以我只听说过它影响机构决策的传闻。我们所有的客户都对在削减订阅成本的同时做出更好的订阅决策的前景感到兴奋,并且一家北美机构的一位图书馆员特别告诉我,他计划在讨论期刊订阅续订时使用这些数据作为谈判筹码。随着我们将覆盖范围逐渐扩大到更多校园,未来几个月的情况将会很有趣。
至于 Mendeley 实时读者人数指数的含义:我认为它只是衡量研究影响力的一个非常好的指标,并且是引文指标的领先指标。从逻辑上讲,您应该先阅读一篇研究文章,然后再引用它——尽管有一些研究表明,在没有阅读的情况下引用研究文章的情况太常见了[1]。然而,我们从未将解释数据视为我们在 Mendeley 的工作:我们希望成为中立的数据提供商,让每个研究领域自行决定哪些指标对他们很重要以及如何解释它们。
有趣的是,仅在过去一年里,就有四项文献计量研究发现 Mendeley 的读者人数数据与 Thomson Reuters 的影响因子、Scopus 引文索引和 Google Scholar 引文[2]、[3]、[4]、[5] 之间存在显着的相关性,同时也指出了 Mendeley 的覆盖范围非常广。
是否有人试图操纵 Mendeley 的数字?
据我们所知没有,而且这样做会非常困难。由于 Mendeley 的规模——我们现在跟踪超过 200 万用户的数据——以及其分布式特性,您必须从不同的计算机创建数千个虚假的“傀儡”帐户,并让所有这些傀儡帐户阅读特定作者的文章。我们确实有措施来防止机器人创建帐户,而且我们肯定会注意到像我刚才描述的那种奇怪的使用模式。因此,操纵我们的数据比操纵引文要困难得多,而正如我确信您知道的那样,这已经是一个相当普遍的问题。今年早些时候,汤森路透将几份期刊从其引文索引中剔除,因为它们的编辑人员篡改了他们的引文指标。
我要感谢 Henning 博士接受采访。图片由 Mendeley 提供。
免责声明:尽管大多数引用的文章都是我的论文导师写的,但它们是由 Henning 博士引用的——我们目前只是在做很多关于 替代计量学 的工作。
[1] Simkin, M.V. & Roychowdhury, V.P. (2003). Read before you cite. Complex Systems. 14:269-74.
[2] Li, X., Thelwall, M., & Giustini, D. (2011). Validating online reference managers for scholarly impact measurement. Scientometrics.
[3] Li, X., & Thelwall, M. (2012). F1000, Mendeley and Traditional Bibliometric Indicators. 17th International Conference on Science and Technology Indicators.
[4] Priem, J., Piwowar, H.A., & Hemminger, B.M. (2012). Altmetrics in the wild: Using social media to explore scholarly impact. http://arxiv.org/abs/1203.4745
[5] Bar-Ilan, J. (2012). JASIST@mendeley. ACM Web Science Conference 2012 Workshop. Evanston, IL.