机器学习方法预测结晶度

最大的一个障碍时研究分子的结构是能够获得x射线衍射在水晶形体。现在,理查德•库珀杰罗姆柳条英国牛津大学的发展机器学习的方法来预测是否有机小分子能够使具体化。由于结晶度对确定结构至关重要,还有许多药物的,这项工作可以提供有价值的信息。

机器学习涉及到建筑的算法,可以从数据中学习,而且它已经使用在过去预测的溶解度和熔点材料。库珀和柳条开始测试是否简单的二维信息,如原子类型,债券类型和分子体积,可以用来预测材料是否会使具体化。

数据集得到的剑桥晶体数据中心(CCDC)和、商用化合物的数据库和模型训练和测试一些分子的性质,以确定哪些是最重要的在预测结晶度。可旋转键数和0吗?v分子连接性指数,给出了3 d体积的间接测量,证明是关键变量和产生一个模型是80%准确的。

0我发现‡v给最高的预测精度确定结晶倾向

的分析告诉我们,是否有材料应该使具体化,因此当花费努力试图获得一个水晶样品,”库珀解释道。模型还可以提供信息是否改变一个小功能,如官能团,可能会使一个分子或多或少可能使具体化

晶体学专家投入工作背景:西蒙•科尔斯英国国家结晶学服务主任说,“许多的科学领域一个新时代的边缘,我们已经收集个人数据集几十年了,现在可以申请informatics-based在这些集合的方法,不仅观察趋势和推导规则还预测”。皮特木中国疾控中心的科学家说的结晶度的可能性,或crystallisability,小分子具有重要意义在制药行业的大多数小分子药物在结晶状态。

将来库珀和柳条希望其他变量纳入模型,如温度和溶剂,目前正在测试他们的模型在一系列材料的结晶度的边缘为了得到更深入的机制,确定这些材料使具体化。