本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点
科学家共享原始数据的方式和地点不断变化,这引发了对如何引用这些日益普及的数据集的指南的需求日益增长。
由于收集和存储数据的(相对)容易性,科学家们正在产生比以往任何时候都更多的数据。通常,科学家们收集的数据超过了他们能够分析的数据量。他们没有让这些未分析的数据在硬盘崩溃时消失,而是以数据集的形式发布原始数据。因此,数据集作为独立的、独立的软件包变得越来越普及。过去,任何可供其他科学家使用的数据都将与其他类型的出版物相关联——例如,在期刊文章中以表格形式印刷,在书中以图像形式包含等等——并以此方式引用。
既然我们可以找到“独立存在”的数据集,科学家们就需要能够引用这些来源。
关于支持科学新闻业
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和思想的具有影响力的故事的未来。
不幸的是,传统的引文手册在帮助科学家弄清楚在参考文献列表中包含哪些要素方面做得不好,要么忽略数据,要么使事情过于复杂。
我查看了我图书馆参考咨询台后面书架上的引文手册,并没有找到太多明确的建议。许多手册自2006年或2007年以来就没有更新过,不太可能提供最新的建议。一些手册简要提及了引用数据的想法,就好像数据来自印刷参考书一样。另一些手册则侧重于数据来源的数据库,并假设不会有明确的作者(或创建者)。许多手册建议包括出版地点,这在网络世界中变得棘手且不相关。
最好和最相关的建议来自DataCite合作组织。他们的使命是鼓励科学家在其工作中引用数据集,并为此提供明确的指南
创建者(出版年份):标题。出版商。标识符
作者可以根据需要轻松调整格式,以符合期刊的格式指南。如果适用,DataCite 的人员建议可以包含另外两条信息。
创建者(出版年份):标题。版本。出版商。资源类型。标识符
让我们更仔细地看看其中的几个要素
创建者 - 占据通常“作者”所在的位置,这具有相同的功能,并伴随相同的问题。可以列出多个姓名,或者可以将整个组织列为创建者。发布数据背后的理由之一是向收集数据的人员给予适当的认可。
出版商 - 使数据可供他人使用的实体。这可能是像 Dryad 这样的数据出版商,或者是学术机构的机构知识库,或者许多其他选择。
标识符 - 这应该是分配给数据集的DOI。DOI(数字对象标识符)是数字项目的唯一编号。它可以帮助您找到该项目,即使其 URL 发生更改。DOI 通常由出版商注册,DataCite 为数据集提供 DOI 注册服务。DataCite 建议将 DOI 作为可点击的 URL 包含在内,例如 http://dx.doi.org/10.1038/493159a
资源类型 - 您引用的事物的类型,用一个词描述。示例包括:图像、数据集、软件、声音、视听等。
然后可以像书籍和文章一样在正文中引用数据。重要的是,努力收集和组织这些数据的人员因其工作而获得认可(通过您的引用)。
DataCite 的数据引用模式承认数据通常作为独立资源存在,并使引用这些资源变得简单明了。您可以查看他们详细的元数据模式,或在其网站上了解有关该组织的更多信息。