研究提供基础数据引用25%比那些不经常

研究论文,使他们的底层数据公开可用的明显更可能被引用在未来的工作中,根据分析由阿兰·图灵研究所的研究人员一直在伦敦作为预印本出版。研究,目前在同行审查,调查了近532000篇文章超过350开放获取期刊发表的科学公共图书馆(PLoS)和生物医学中心(BMC)在1997年至2018年之间,并发现那些直接链接到源数据集获得平均25%的引用。

“我们发现一半的一百万篇论文被发表的这些开放获取期刊在研究期间,和三分之一包括数据可用性语句,然后这些论文检查看看是否有一个引用的好处,”解释道伊恩•Hrynaszkiewicz数据发布主管出版商Springer自然。结果清楚地指出引文优势,高达25.36%的文章,包括通过一个URL链接到一个存储库或其他永久性标识符。这与之前较小规模的研究结果是一致的,特别集中在基因表达微阵列或海洋数据。

这个新的证据可以更好地证明相关的成本的增加更强的研究数据政策的引入,Hrynaszkiewicz和他的同事说。他们控制了几个因素会影响引用,如作者的数量和引用,以及作者的声誉。

“通过研究论文和底层数据公开,作者正在增加他们的可见性,然后导致数据重用和更多的引用,“Hrynaszkiewicz说。他也指出,更多的成功,可见研究小组可能会有更多的资源处理共享基础数据和代码。

开放数据的新激励机制

彼得木栓,哈佛大学图书馆的学术沟通和办公室没有参与这项研究,结论是重要的,因为他们说可能促使期刊为作者开放数据集和创造新的激励他们从内部链接的文章。

许多期刊开放数据政策,但一些作者无法得到遵守,”木栓说。获取数据的技巧是打开一个小在发表前,这样可以包含在文本的链接。期刊作者现在可能有动力去增加压力使他们的数据打开一个具体的时间表。”

彼得Murray-Rust,在英国剑桥大学的一个化学家冠军开放获取出版、调用预印本研究“做得好”和“良好的作品”。然而,他说重要的是要确定这些链接的数据,研究人员发现检索真实文件有用。“一个负责任的科学出版商会说你应该有InChIs和摩尔文件,但我们经常有pdf或jpeg文件,这些文件主要是破坏信息的墓地,Murray-Rust解释说。他目前正在编写软件将pdf回光谱以使他们更可用。

他还认为,引用时使用有限试图评估是否高质量或开创性的研究。我们应该测量不是引用,但重用的数据,”他说。Murray-Rust指出,才有可能实现这一目标,如果研究人员把他们的数据在存储库中,从而创建一个公共记录,使引文信息来衡量和跟踪,以及视图和下载。