分子动力学正处于模拟大块物质的阶段——但不要指望它能预测未来

电视连续剧开发者它的前提是,一台足够强大的量子计算机可以完全模拟世界,从而可以准确地将事件投射到遥远的过去(钉十字架或史前),并预测未来。从表面上看有些荒谬,这个场景提供了一个框架,在这个框架上悬挂着关于决定论和自由意志的问题(以及不那么令人愉快的量子力学的多世界解释)。

量子计算机在分子模拟方面的作用还有待观察,但对它们的兴奋不应掩盖经典模拟领域仍在取得的惊人进展。完整的从头开始量子化学计算在计算上是非常昂贵的,即使有不可避免的近似,所以将这种程度的精度带到传统的分子动力学中是具有挑战性的,在传统的分子动力学中,分子相互作用仍然是典型地用经典势来描述的。即使是模拟纯水也很困难,因为在纯水中,氢键和分子离子解离的精确建模涉及量子效应。

现在,一个由美国普林斯顿大学的张林峰和罗伯托·卡组成的团队进行了这项研究从头开始分子动力学模拟对于多达1亿个原子,探测的时间尺度可达几纳秒。1当然,那离开发者与现实一模一样的幻想。但它表明,具有量子精度的模拟正在达到这样一个阶段,即我们可以用大块物质而不是小把分子来讨论。

培训和学习

他们是怎么做到的?研究人员已经探索了几年的诀窍是用机器学习(ML)取代量子化学计算。机器学习的一般策略是,算法通过使用许多已知答案的示例进行训练来学习解决复杂问题,并从中推断出某些高维空间中解决方案的一般“形状”。然后,它使用这个形状来插入以前没有见过的例子。熟悉的例子是图像解释:机器学习系统计算出要在猫的照片中寻找什么,这样它就可以发现哪些新图像中有猫。它可以非常好地工作——只要它没有出现在远远超出训练集范围的情况下。

这种方法被广泛应用于分子和材料科学,例如从元素组成预测晶体结构,2 - 3或者晶体结构中的电子结构。4 - 5在后一种情况下,体电子特性(如带隙)传统上使用密度泛函理论(DFT)来计算,这是一种近似解决多体系统量子力学方程的方法。在这里,电子密度的空间分布从一些最初的猜测开始计算迭代,直到它以自洽的方式拟合方程。但是它的计算量很大,机器学习通过从已知的情况中计算出给定原子构型的电子分布来规避计算。

该方法原则上可用于分子动力学,通过在每个时间步长重新计算电子密度。Zhang和他的同事们现在已经展示了利用超级计算技术、聪明的算法和最先进的人工智能,这个想法可以被推进多远。6他们为一块铜原子的测试案例提供了多达1.13亿个原子的模拟结果,从而使量子化学对块状机械行为的预测接近于现实。与此同时,他们模拟的液态水含有多达1260万个原子。

难以区分,但速度更快

对于可以与全量子DFT计算进行比较的小系统,研究人员发现电子分布基本上与完全计算没有区别,同时速度提高了4-5个数量级。他们的系统可以在很宽的温度和压力范围内捕获水的完整相图,并可以模拟冰核等过程。在某些情况下,水可以粗粒度的这样,在不明确包括氢原子的情况下,氢键仍然可以建模。7研究人员说,很快就有可能在接近微秒的时间尺度上跟踪大约100万个水分子的这一过程,使他们能够观察大气中液滴和冰的形成等过程。

对于可以与全量子DFT计算进行比较的小系统,研究人员发现电子分布基本上与完全计算没有区别,同时速度提高了4-5个数量级。他们的系统可以在很宽的温度和压力范围内捕获水的完整相图,并可以模拟冰核等过程。研究人员说,很快就有可能在接近微秒的时间尺度上跟踪大约100万个水分子的这一过程,使他们能够观察大气中液滴和冰的形成等过程。

这两个测试用例都是相对同质的,涉及到大部分相同的原子或分子。尽管如此,这个的前景深度学习的方法看起来很适合研究更多的异质系统,比如复杂合金。8当然,一个非常有吸引力的目标是生物分子系统,在生物分子系统中,模拟完全溶剂化的蛋白质、膜和其他细胞成分的能力可以帮助我们理解复杂的中尺度细胞过程,并预测候选药物的行为。这里的一个挑战是如何包括远程相互作用,如静电力。

离这儿很远开发者风格的思想和历史模拟,这可能永远只是幻想。但该系列中的一个场景展示了一个可能更容易实现的目标:模拟雪花的生长。这是宣传模拟器艺术的绝佳方式。