战略化合物通过机器学习在一个巨大的化学网络查明

在超过一百万的化合物,一种算法已经确定了569个分子,推动循环经济,在化学废物成为新材料的原料。称为战略分子,他们是地下通路的关键球员产生的废物,如萜烯混合物造纸工业——有价值的化合物如毒品。

此刻,如果你有一个废物流,你想产生一个高价值的最终产品,有很多的不确定性以及路线,“解释道Jana玛丽•韦伯来自英国剑桥大学。人们通常专注于非常具体的废物原料,然后看看他们能做。或者他们从产品,一步一步,最终产品与高价值的废物。不过,这两种方法都需要大量的化学专业知识和计算能力。

图像显示潜在战略分子识别的算法

来源:©2019爱思唯尔有限

该算法识别关键战略分子可以帮助驱动一个圆形,杜绝浪费

一个算法的帮助下,韦伯,阿列克谢Lapkin彼得利奥,已经确定了569个分子作为关键的浪费与价值之间的连结点。我们直接搜索向战略分子,然后从战略分子,两个反应步骤所需的最终产品,”韦伯说。通过这样做,我们可以减少计算时间由两个数量级。

团队超过一百万化合物开采和近一百万的反应从Reaxys数据库并组装成一个巨大的化学网络。然后他们让一个隔离森林算法找到这些分子最多的最中央位置连接和多步反应。

战略分子中有许多常见的中间体等,二氧化碳,甲醇、醋酸、苯酚。但也有化合物重要的特定行业分支,如过氧化苯甲酰——一个激进的起动器聚合——制药的前兆piceol和超分子建筑块tetraphenylethylene

匹配的人类经验

算法的证明,它几乎可以匹配人类专家——尽管它不知道任何化学。通过排名项目同样谷歌排名搜索结果,发现一半的化合物已被列为重要的构建模块国家可再生能源实验室报告

的传统方法,人类将如何识别重要的化合物,通常需要大量的知识和经验,这可能不容易获得,”说东大张来自英国曼彻斯特大学,在那里他从事生物处理系统工程和机器学习。这项工作提供了一个更系统、更聪明和更自动化的方法来识别潜在的重要化合物处于早期研究阶段,这是创新和值得研究。”

尽管浪费的方法可以找到合成路线组件进一步战略分子和增值的化学物质,它还不能评估是否这些途径在化学上是可行的。关键输出我们的工作,我们就可以专注于开发过程早期阶段装配的所有可能的路径,”韦伯说。