机器学习与计算相结合推导出描述符允许科学家们找到新的特殊类催化剂使用的例子只有少数实验数据点。领导的团队Franziska Schoenebeck来自德国亚琛工业大学开发了一种新的工作流确认21膦配体,可以形成双核的钯(I)配合物具有特定几何和空气稳定的更常见的钯(0)和钯(II)的物种。1

这些二聚体是非常有前途的催化剂和不同的反应相对于大多数常用palladium-based催化剂,”评论托拜厄斯Gensch从你柏林,德国,他并没有参与这项研究。不过,化学还没有很好理解,因为他们的合成是不可预测和二聚体的配体稳定的影响是未知的。的新方法允许研究人员预测配体,稳定钯(I)这些配合物二聚体和合成一些新的例子,他说。

发现高效的化学催化剂是许多创新的关键,但是不同的物种有不同的活动和选择性,所以找到合适的化合物是具有挑战性的。准确预测物种形成的催化剂,原则上,需要精确的知识的所有物种在给定条件下,可以形成和它们的相对能量——一项艰巨的任务!”指出Marc-Etienne Moret,一个有机金属在荷兰乌得勒支大学的化学家。

这就是为什么化学家通常依赖于反复试验,检测配体,他们认为可以工作。的科学家也开发地图对配体进行分类根据其性质;这可以帮助他们识别有前途的候选人视觉,Moret补充说。但是在某些情况下,这些方法不帮助。新的研究结果显示,机器学习可以成功地预测配体,直觉和目视检查成功,他说。“这可能会加速新催化剂的开发通过识别之前承诺目标,广泛在实验室中测试它们。

科学家们第一次使用一个算法来过滤348配体根据他们的一般性质,然后进行额外的集群通过引入问题特定的密度泛函理论计算得到的数据。这个策略允许他们组的大数据集分解成更小的子集更大的相似性,根据手头的问题。预测的团队然后验证一些配体实验,包括一个之前从未合成,用于制造新的钯(I)二聚体。

Gensch指出,系统能够识别新型配体使用只有五个实验数据点。其他机器学习方法如回归模型需要更多的数据作为输入,”他说。很少的工作能力与数据结果从数据库结合使用一个通用的配体和高度信息问题特定的描述符,配上一个简单,但功能强大,两阶段聚类方法。

算法的预测的准确性是非凡的,”Moret说。这表明配体,否则可能从来没有测试过。这种方法可能有助于解决许多相关问题的经验或计算数据存在,但还没有形成一个直观地理解画面。”