由谷歌公司人工智能部门的研究人员构建的神经网络DeepMind提出了一种细化的密度泛函理论算法。该算法考虑了之前DFT算法中忽略的“分数电子特征”,能够避免一些经常导致这些算法给出高度不准确结果的陷阱。

对于任何比氢原子更复杂的原子系统,Schrödinger方程都无法解析求解,因为电子-电子斥力意味着所涉及的变量急剧增加。这意味着,为了创建分子系统的真实近似值,研究人员必须求助于计算方法。对于一些小分子,可以为每个电子找到方程的近似数值解,并从得到的波函数估计每个分子轨道的形状。然而,计算需求是巨大的,并且急剧增长,因为每一个额外的电子都相互排斥。他说,问题是如何超越这个领域?DeepMind的专家说阿伦·科恩

在20世纪60年代,皮埃尔·霍恩而且沃尔特•科恩表明,原则上,人们可以将分子的电子密度精确地映射到它的能量。由于分子倾向于采用其最低能态,化学家理论上可以在不知道任何单个电子状态的情况下预测分子的状态。科恩后来分享了1998年诺贝尔化学奖他的工作,催生了DFT。然而,这项工作并没有揭示如何计算电子密度,从那以后,研究人员一直在努力寻找更好的“密度泛函”来做到这一点。

理论化学家已经计算出精确的密度泛函应该满足的不断增长的约束列表。其中两个问题是关于分子中原子间电子自旋和电荷的离域化问题。例如,如果你有H2+科恩的同事解释说:“在这个体系中,平均来说,一半的电子在一个氢上,一半的电子在另一边。詹姆斯·柯克帕特里克.“大多数泛函预测,即使在无限远的距离上,这两个原子也会成键——这是DFT中一个很大的错误,因为泛函被它只是整个电子的一半这一事实弄糊涂了。”

研究人员创建了一个自我学习的神经网络,并在虚构的系统上进行训练。科恩解释说:“如果我们想到一个原子,如果我们去掉一个或半个电子,我们也可以想到电子密度。”通过反馈和自我修正的过程,神经网络学会了预测小分子周围的电子密度。

显示计算的图像

来源:©DeepMind

传统的泛函函数(左)预测电荷涂抹在两个相邻的分子上,而DeepMind的泛函函数(DM21)则正确地将电荷定位在一个分子上。

然后,研究人员将其命名为DM21,用于解决几个感兴趣的问题。例如,他们通过预测电离腺嘌呤-胸腺嘧啶碱基对中的电荷密度分布来观察DNA中的电荷传输:尽管今天流行的功能表明电荷分布在两个碱基上,但他们的功能正确地预测电荷只集中在腺嘌呤上。他们还研究了一个更简单的例子bicyclobutane,对此确实存在更基本的计算,并表明它们的泛函结果是相似的。研究人员将DM21免费提供给GitHub上的所有化学家。例如,他们现在打算训练它来研究过渡金属中更复杂的体相互作用,并希望它能对铜酸盐超导等现象提供见解。

“应用机器学习来构建密度泛函近似值并不是什么新鲜事,”他说约翰Perdew他指出,这个想法最早是在20世纪90年代提出的,并在“近年来的许多论文中被使用”。

“这项工作的新奇之处在于,他们通过将顽固但重要的数学约束转化为机器可以学习的数据来满足这些约束。”然而,他指出,使用分数自旋约束来找到基态的能量“是有代价的”,因为基态和激发态之间的微小能量差异会导致自旋振荡和自旋对称性破缺,这对反铁磁体等材料的性质至关重要——以及铜酸盐超导体。