创建了一个算法,可以快速扫描假设包含任何自然元素的晶体结构,找到那些可能是稳定的。程序,这是140000年由机器学习的数据集训练材料,使得预测一样精确量子化学模拟和更有效率。研究人员搜索3100万潜在的结构,发现180万的稳定。这样的搜索可能会找出更好的材料用于多个应用程序。

薛定谔方程是无法解决的化学比氢原子系统更加复杂。化学家们因此往往依赖于从头开始模拟电子密度等DFT计算多电子系统的属性。这些可以非常准确,但是,在大型多元系统,如水晶,他们非常计算代价高昂。作为一个经验法则,DFT可以做任何材料的不到1000个原子单位细胞,”说Shyue萍昂加州大学圣地亚哥分校,但天平严重,你不能轻易DFT数以百万计的材料,即使是简单的材料。

原子间势简化,只需考虑原子的势能表面的形状在不同的环境中。学习这种势能表面的形状,研究人员依赖于机器学习算法。说,说你感兴趣的碳昂。所以,也许你执行DFT计算不同结构的碳能量和力量。然后用这些数据来训练一个机器学习的潜力碳…但这可能不会为硅和碳化硅工作。你必须对每一个重复整个培训过程化学和你一起工作。

心灵控制物质

为了克服这个限制,昂和他的项目科学家陈气图神经网络,使用机器学习的方法,结合了图形表示和算法松散模仿大脑。他们开始从DFT计算能量和原子间力量的140000种已知的和假想的无机结构材料项目-一个开源数据库开始于2011年。这些作为训练数据图称为神经网络算法M3GNet,教本身来推断一个给定一个特定的元素的原子可能表现在不同的配置。结果是M3GNet通用原子间潜在的管理89个不同的元素之间的交互。

5283年的研究人员把任意结构晶体。他们第一次使用M3GNet找到近似的基态。M3GNet“基态”随后又放松了DFT找到更精确的基态。放松M3GNet任意结构的晶体的能量减少了至少10倍后续DFT放松。这表明M3GNet发现系统的基态几乎DFT,但以低得多的计算成本- K的结构57Se34岁,例如,原本需要15 h 32-core处理器DFT计算时,可以计算M3GNet在22个单核的笔记本电脑。现在,成千上万的原子是可行的,”王说。我们正在实施改进的代码使用gpu这将使系统拥有超过100000个原子更可行的。”

此外,陈气,现在微软量子说,两级放松一个优势。“对许多结构,DFT计算会陷入局部最小值。M3GNet放松之后,DFT放松得到较低的能量相比做DFT放松,”他解释说。

图表材料空间

M3GNet搜索3100万年假想的晶体结构和50个或更少的原子单位细胞,发现大约180万潜在的稳定。研究人员分析了2000个使用DFT,同意1578例稳定的预测。研究人员还使用M3GNet预测材料的弹性和声子色散曲线,这是重要的决定属性动态稳定性和热导率等,在这两种情况下他们发现与DFT好协议。

研究者们现在希望该算法可以找到有用的新材料。“这没有合成工作,”昂说。DFT是基准。但是我希望这些预测最终将实验验证。例如,我在锂离子电池工作。的一个属性,你通常感兴趣的是锂离子电导率。普遍的潜力可以处理任意组合的元素周期表,所以可以用来模拟任何潜在的锂离子电池材料。

说,这是非常令人印象深刻的工作巴勃罗Piaggi在新泽西的普林斯顿大学。通常深度学习在分子模拟是用来研究一个特定的物质和少量的化学元素。摘要他们完全相反方向…我的印象一般是预测新化合物的工作有着巨大的潜力,为不同的应用程序可能会超越已知的材料。”