安德烈亚斯•巴斯有关研究表明,从分子的角度揭示了大局

一个科学家考虑研究领域可能会问以下问题:“什么机会?这个领域有多大?文学可以多少?化合物是已知的多少?有任何新的化合物没有调查了吗?我怎么能找到潜在的研究伙伴吗?”

传统上,这些问题可以解决使用文献计量学——引文出版数据。但这远非完美:引用计数在几个方面是有偏见的,他们是不完整的和容易出错的。此外,引用很难归类对学科和研究主题。

另一种方法是提供的而不是看的化合物。正如提到相关的出版物在纸生产文献计量学的引文数据,提到的化合物可以以类似的方式使用。

许多领域的研究,特别是在化学和材料,主要集中在化合物——有时一个化合物。化合物的数量在一个特定的化合物类,和相关的出版物,因此可以衡量的研究活动和科学减肥。化合物是明确的,容易归类,可以通过分子和结构精确公式访问或子结构。简而言之,相反的出版物和引用计数,我们计数和地图的化合物。

热点和缝隙

通过分析研究领域使用化学数据库,结合化合物和文献信息,我们可以获得更丰富、更丰富的和有用的研究景观的照片。1、2在这种“化学文献计量学”,我们可以用不同的方法定义一个研究领域:元素的化合物,化学结构,甚至是关键字。使用现有的化学数据库与高级知识索引和标准化,我们可以获得一套可靠的(大)的化合物的定义相匹配的研究领域。答案设置可以进一步增强与其他描述符或通过结合复合集与其他数据,如从实验或理论计算数值属性。

在自己的工作中,我们使用了复合(注册表SM)和文学(CAplusSM)数据库的化学文摘服务(CAS)。这些是最全面的化学数据库,包含记录化合物被中科院自1907年以来,以及相应的出版物。智能地处理这些数据使化学文献中提取信息。

计算化合物的出版物和引用打开新的视角基于数据的科学发现,它可以补充和刺激实验和理论研究。的复合映射可以用来识别热点研究领域,研究活动是高,但也差距或白色区域,新的研究存在的机会。

而不是计数出版物和引用,我们可以计算化合物

例如,我们知道,最高温超导体属于一类稀土铜酸盐。限制自己的化合物与四个不同的元素,我们获得超过65000的出版物(包括专利),指的是超过6000特定化合物。几乎一半的文学处理一个化合物:YBa23O7。映射的化合物显示主要的焦点研究一直局限于少数元素组合:Ba与Y,洛杉矶,公关或Nd;和Sr。对于大多数其他元素组合只有少数调查已经出版,还有差距,例如和Mg的化合物。2

对于某些应用程序也可以使用综合数据库与无机晶体结构数据库(听障)或剑桥结构数据库(CSD),专注于一个特定的研究领域。在最近的一次审查,多个应用程序在计算材料设计在“总结基于数据库搜索。3作者进行的热力学计算和电子性质与数据库搜索和分析技术,获取材料表命令一组物理性质描述符。这些可以作为新材料设计的基础。比这更复杂的化学文献计量学方法,但更广泛,因为它可以应用于化学和材料研究的各个领域。

退一步

化学文献计量学的力量在于它提供了独特的视角。航空考古学领域,就是一个很好的类比模式看不见地面观察者在哪里从空气中透露,在《观察家报》获得更广泛的观点。

新方法分析和可视化的大量数据(“大数据”)正变得越来越重要。被研究人员生成的数据量极大地增加,因此它是至关重要的开发可以管理这些大型数据集的新方法。阅读每一个发表在某一研究领域不再是可能的。事实上,人们抱怨的信息溢出年初以来,科学出版社出版。我相信会有一个范式转换,即从积累知识通过阅读创造知识的搜索和分析。决定性的前提是信息需求与高级搜索选项的组合。新范式将集中在模式识别和科学家们也习惯了这种方法。

安德烈亚斯•巴斯是泡沫的饮料业务发展主管卡尔斯鲁厄,德国