每天,全球在 Twitter 上广播五亿条推文。这个社交媒体网站拥有如此多关于个人生活的细节,对于希望在人类行为中找到模式、梳理出健康状况的风险因素以及追踪传染病传播的科学家来说,是一个数据宝藏。例如,通过分析孕妇推文中的情绪线索,微软研究人员开发出一种算法,可以预测那些有患产后抑郁症风险的人。美国地质调查局利用 Twitter 追踪地震位置,因为人们在 Twitter 上发布关于震动的消息。
到目前为止,大多数感兴趣的科学家一直在使用数量有限的推文。虽然大多数推文是公开的,但如果科学家想要自由搜索所有推文,他们会通过 Twitter 的应用程序编程接口进行,该接口目前仅扫描 1% 的存档。但这即将改变:今年二月,该公司宣布将向研究人员免费提供自 2006 年以来的所有推文。既然一切都唾手可得,Twitter 作为研究工具的使用可能会猛增。随着更多数据点的挖掘,科学家可以提出更复杂和具体的问题。
这一公告令人兴奋,但也提出了一些棘手的问题。Twitter 是否会保留对科学发现的任何合法权利?鉴于 Twitter 用户无意为研究做出贡献,将 Twitter 用作研究工具是否符合伦理道德?
关于支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。
为了解决这些担忧,弗吉尼亚理工大学的计算流行病学家凯特琳·里弗斯和布莱恩·刘易斯在二月份发布了 Twitter 数据伦理使用指南。 除此之外,他们建议科学家永远不要透露屏幕名称,并公开研究目标。例如,虽然从公共场所收集信息被认为是符合伦理道德的——而 Twitter 是一个公共场所——但在未经用户同意的情况下分享关于单个用户的身份信息是不道德的。里弗斯和刘易斯认为,随着基于 Twitter 的研究项目成倍增加,科学家必须考虑并保护用户的隐私。伟大的数据伴随着伟大的责任。