机器学习算法开发了科学家在日本老分子注入新生命。称为无限Objective-free勘探或宝藏,它允许研究人员搜索化学数据库与正确的分子性质看到他们使用。团队展示了他们的技术的力量通过分子能够在太阳能电池工作从数据库用于药物发现。

化学再利用涉及分子或物质和为它找到一个全新的使用。合适的分子化学再利用往往站除了大集团在考虑一个属性。这些材料是out-of-trend和还显示先前未被发现的异常特征。

”在公共数据库中有很多分子,但每个分子的性质主要是未知的。这些分子合成了一个特定的目的,例如药物开发,所以没有测量无关的属性,解释道Koji津田中心的高级情报和领导发展的宝藏。有很多的宝藏在数据库中。

下降的界限

然而,out-of-trend材料是具有挑战性的发现使用现有的方法。的机器学习材料发现需要底层数据覆盖大面积的空间所需的属性,而现有的化学知识往往依赖于著名的材料,”说詹姆斯Cumby英国爱丁堡大学的工作,探讨了使用数据库挖掘和量子化学功能材料。

一个图像显示搜索

来源:©祺Terayama /日本

经过最初的准备步骤(步骤1),搜索是通过重复执行以下三个步骤:构建预测模型属性(步骤2),选择一个候选人使用斯坦新奇得分基于斯坦差异(步骤3),然后由实验或仿真评估选定的候选人(步骤4)

当前机器学习发现路线是如何工作的是另一个僵局找到out-of-trend材料。一些需要提前一个适当的优化目标。其他技术可以更随机但只有探针集属性空间。这将创建边界的方法不能搜索之外。

在大多数研究基于机器学习优化的材料,需要事先确定一个目标函数,“津田解释道,他指出,一个典型的例子是蛋白质绑定关联。为了克服这个边界和目标函数限制,津田的团队想出一个方法来解析分子基于相对新奇。

的Blox方法地址的缺点之一其他常用的探测算法针对化学景观:human-inputted边界条件的依赖,”评论克Corminboeuf研究机器学习和计算化学在瑞士联邦理工学院洛桑(EPFL)。

Blox工作流包括数学称为斯坦的技术差异,描述为“清新非常规”碰面Gryn 'ova计算化学家在德国海德堡大学。这个过程通过选择材料开始随机从数据库和观察它们的属性通过实验或仿真。然后应用机器学习预测模型来确定这些属性更迅速地在一个大的数据集和所需的材料是由策划安排一个对另一个属性。此时,斯坦差异发挥作用,使Blox所以善于out-of-trend分子。

“寻找一种新的分子,需要定义一个分子之间的距离和分子的集合在数据库中,“津田解释道。斯坦差异强调分子遥远的从数据库的主要分组,策划在房地产空间。更大的距离意味着一个属性和分子out-of-trend可能是不寻常的。

一旦out-of-trend候选人是发现它可以评估实验或仿真来确认如果它真的是一个out-of-trend材料,因此适合化学再利用。

太阳能获得

效用的宝藏,团队用它来探测100000分子锌数据库——一个公共数据库,研究人员通常筛选生物活性化合物。只有这一次,他们在寻找与高度的光敏分子。Blox奉命地图属性空间作为第一单线态激发态的吸收波长和振子强度。从这个搜索,八out-of-trend分子可用于应用程序如太阳能电池被发现使用密度泛函理论及其属性确认。

一个图像显示搜索吸光分子摩尔吸光系数高

来源:©祺Terayama /日本

该团队使用Blox搜索吸光分子摩尔吸光系数高药物候选人的数据库中

”这是一个诱人的探索性质的工具除了常见的趋势,希望能找到在其他化学和材料科学社区out-of-trend系统需求,“说Gryn 'ova。Crominboeuf还说Blox拥有更大的潜力,它将“特别吸引人的设计和发现材料,最终的效率取决于多个独立的条件,例如孔运输材料”。