本文发表于《大众科学》的前博客网络,反映作者的观点,不一定代表《大众科学》的观点
研究博客中对学术信息的讨论
你们中的一些人知道,Mike Thelwall、Judit Bar-Ilan(都是我的论文导师)和我自己发表了一篇名为“研究博客与学术信息的讨论”的文章,发表在PLoS One上。许多人对这篇文章表示了兴趣,所以我想写一篇“导演评论”帖子。当然,我会把你们所有的推文和博客文章保存下来,以供日后研究。
样本
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。
我们对来自Researchblogging.Org (RB) 的 126 个博客(共 135 位作者)进行了描述,RB 是一个聚合处理同行评审研究的博客文章的平台。其中有两位佼佼者各自拥有两个博客,还有 11 个博客有两位作者。
虽然我们对研究博客的兴趣早在我们听说 RB 之前就开始了,但是阅读一篇使用 RB 的文章真正启动了这个项目。Groth & Gurney (2010) 写了一篇题为“使用文献计量学研究网络上的科学话语:一个化学博客案例研究”的文章。这篇文章读起来令人着迷,因为它将文献计量方法应用于博客。正如标题所说,Groth & Gurney 从 295 篇关于化学的博客文章中提取了参考文献,并像分析同行评审文章的引文一样分析了它们。他们之所以能够做到这一点,是因为他们使用了 RB,它只聚合那些花时间正式引用其来源的博主的文章。在那一刻,我们简直垂涎欲滴。人们自愿以学术方式引用?简直是圣诞节!
我们选择 RB 不是因为它是一般科学博客的最佳代表;我们选择它是因为博主使用的结构化引用。RB 聚合的博客文章是出色的引文模因载体。正如 Bar-Ilan 教授所说,RB 文章是正式交流中的引文与博客的自由形式写作之间的“过渡阶段”。它就像文献计量学的始祖鸟。事后看来,我们应该更加强调我们对博客化的兴趣(这也是为什么这篇文章被称为“研究博客中对学术信息的讨论”而不是文章的实际名称)。
RB 还具有人工编辑的优势,他们决定聚合哪些申请的博客,因此我们无需从数据中筛选出伪科学和垃圾博客。我们进一步缩小了样本范围,只关注截至 2011 年 1 月在 RB 中至少有 20 篇文章的博客,以确保我们有足够的博客化“素材”进行研究,并且只有一位或两位作者。制定最后一个规则是为了确保这些博客至少具有基本相似性,这样我们就不会将苹果和橘子进行比较。
但是,选择 RB 也意味着我们只选择了使用它的博主,这是一个自我选择的人群。可能存在——也确实存在——许多使用结构化引用的博主,但他们要么不屑于使用 RB,要么甚至不知道它的存在。RB 有其自身的偏见,当人们查看其标签系统时,这些偏见非常明显:生物学有 28 个子标签,心理学有 21 个,而像历史和社会学这样的整个学科仅是“社会科学”下的子标签。
被博客引用最多的期刊
Groth 和 Gurney 已经发现化学博客文章引用了来自高影响力期刊的研究,但我们必须确保其他学科也是如此。我们从样本中 126 个博客的每篇博客的最后五篇文章中提取了博客化内容,您可以在这里看到结果
与大多数科学家一样,科学博客作者会引用具有高影响因子的期刊。Science、Nature 和 PNAS 是 Journal Citation Reports (JCR)“多学科”类别中影响力最高的期刊。我们提出了几种解释
博客作者会引用他们知道的东西——在研究时,近 60% 的博客作者隶属于研究机构。27% 是研究生,32% 拥有博士学位。考虑到这些期刊在学术界的声望,博客作者经常阅读和引用它们是意料之中的。仅仅因为我们处于博客领域,并不意味着博客作者不受学术规范的影响(考虑到他们使用引文的方式,我们非常肯定他们受到了一些影响……)
另一个解释是媒体偏爱高影响力期刊(享有盛誉的同行评审期刊具有媒体所喜爱的“权威”)。如果博客作者想评论媒体对文章的报道,他们必须引用媒体使用的相同文章。
博客作者的教育水平分布
但是,在引用次数最多的列表中排名第四的 PLoS One 在 JCR 的“生物学”类别中的 86 种期刊中仅排名第 12 位。它仍然属于生物学类别的第一四分位数,但其排名和影响因子远不如 Nature、Science 和 PNAS。我们可以假设 PLoS One 在研究博客作者中的受欢迎程度是因为它是最著名的开放获取期刊之一,而且它主要发表生物学研究(RB 具有生命科学偏见)。此外,PLoS One 是一本大型期刊(2009 年发表了 4,403 篇文章,而 Nature 和 Science 分别为 866 篇和 897 篇),因此在统计上遇到 PLoS One 博客化的可能性更高。我们的结果非常类似于 Mendeley 排名(一个流行的学术书签网站)。
谁动了我的数据?
在网络研究中,数据始终是一个棘手的部分。在处理文章、同行评审期刊的引文等内容时,数据或多或少是稳定的。诚然,文章会被撤回,期刊会更改名称,但它们会在可管理的阶段进行更改。另一方面,我的数据一直在逃离我。地质学家 Anne Jefferson 和 Chris Rowan 的 Highly Allochthonous 联合 Twitter 列表已经不复存在,剩下的只是两位博主的个人帐户。Ed Yong 现在有 19,598 名 Twitter 关注者,而不是撰写论文时的 11,638 名。等我发出这篇文章的时候,他无疑会有更多关注者。Krystal D'costa 将她的博客移到了 SciAm 网络。甚至我的博客(也是样本的一部分)也移动了!网络的不断变化给信息科学家带来了很多麻烦,也使得结果很难被复制。
您可能已经注意到我没有在这里讨论性别问题(只有 22% 的博客有女性作者)。我将把它留到以后关于科学博客中女性的文章中讨论。
参考文献
Shema H, Bar-Ilan J, & Thelwall M (2012). Research Blogs and the Discussion of Scholarly Information. PloS one, 7 (5) PMID: 22606239
Groth, P., & Gurney, T. (2010).使用文献计量学研究网络上的科学话语
:一个化学博客案例研究。WEbSci10 会议论文集:在线扩展社会的前沿。