你的研究是否曾经因为发现化合物的结构错误而偏离轨道?你并不孤单。现在,一个开源程序可以让你回到正轨,它可以告诉你在结构的什么地方检查错误。此外,它可以自动用于高通量的机器人合成。

DP5,由乔纳森·古德曼而且亚历山大•霍沃斯在英国剑桥大学,是一个自动的13C核磁共振结构验证器能够解决棘手的情况与经验丰富的化学家的准确性。集成古德曼小组之前的工作在DP4- ai上,它在原始DP4对潜在结构列表进行排名的能力上添加了自动核磁共振处理,新的DP5程序计算出单个候选结构的可能性。

古德曼说:“如果一个实验给出了很高的可信度,证明这种结构一定是一系列可能性中的一种,那么DP4仍然是最好的选择。”“然而,在结构未知或不确定的情况下,DP5可以提供DP4不能提供的信息。”

不正确的分配是一个主要问题。古德曼说:“最明显的例子就是天然产物被错配,然后需要重新分配,但这些只是冰山一角。”“更常见的情况是,在研究项目中,分子被错配,错误被发现,项目因此被推迟。”检查结构确定是所有制造分子的项目的核心部分;快速、准确地完成它会让项目进展得更稳定、更可靠。”

古德曼的团队十多年来一直在尝试解决自动化结构验证的问题,但技术还无法应对挑战。古德曼说:“我们既没有足够的数据,也没有足够的计算机能力让它发挥作用。”“现在,有了更多的数据,更强大的计算机能力,再加上亚历克斯·豪沃思的洞察力和辛勤工作,我们有了一个有用的程序:DP5。”

伊丽莎白Krenske他在澳大利亚昆士兰大学的研究涉及用于天然产物结构确定的分子光谱性质的计算预测,他同意DP5“确实是一个重要的进步”,并补充说“由于其自动化的工作流程,该技术应该立即应用于高通量合成,以及复杂分子的定制合成”。她还称赞了该程序的用户友好界面,它通过给分子中的每个碳标上概率分数和颜色编码来帮助结构修改,以显示哪些区域可能需要改变。

该程序使用DP4-AI从化学结构自动生成dft预测光谱。NMR- ai是DP4-AI的一部分,自动分配原始实验光谱或NMR信号列表的位移。然后,它使用原子环境特定的统计模型来生成结构中每个碳的概率分数。这些组合成一个整体的分子概率。

Goodman和Howarth用来自数据库的5140个结构和相关的实验光谱测试了该软件NMRShiftDB.他们将每个实验光谱与所有碳原子数量相同的结构的预测光谱配对。在另一个挑战中,他们对5330个不正确配对的子集进行了加权验证,使错误分布与正确配对的错误分布相同。DP5能够识别这两组配对中哪些是正确的,哪些是不正确的,即使是那些可能让人类困惑的高度相似的配对。

为了演示DP5在真实场景中的使用,他们在13个错误分配和修改结构的实际情况下设置了DP5。DP5识别出了除了一个原始错误结构之外的所有错误结构,使它们的概率接近于零。它还赋予了9个正确结构很高的正确概率。

Goodman和他的团队正在探索,DP5所依赖的相对较慢的DFT计算是否可以被更快的机器学习模型所取代,从而使整个过程更加高效。他们还在研究是否可以将DP5技术应用于其他核素的光谱。