机器学习不再局限于计算排列

几年前,当我和一位著名的天体物理学家共乘一辆出租车时,我们开始讨论人工智能的未来。他说,这将使大多数职业变得多余。医生,老师,应有尽有。

“那么,你的也是?”我问。

不,他回答说,人工智能系统不具备科学研究所需的创造力。我怀疑他知道这是一种特殊的恳求,我们都笑了。

创造性思维

在他的新书中创造力密码,数学家马库斯·杜·索托伊调查了人工智能入侵曾经被认为是人类智能的领地的现状:视觉艺术、诗歌、音乐和科学。杜·索托伊指出,人工智能不仅在国际象棋和围棋等游戏中击败了人类最好的对手,而且以一种令专家们惊讶的方式做到了这一点:不是通过无情的碾压,而是通过做出人类玩家认为“美丽”、自己从未想象过的大胆动作。计算机的艺术努力还没有超越“有趣”实验的阶段——没有一个会让你大吃一惊——但想象这永远不会发生是愚蠢的。

杜·索托伊没有深入研究人工智能在科学中的应用,只是考虑了DeepMind (AlphaGo背后的公司)开展的Mizar项目和谷歌等算法是如何根据基本公理得出所有可能的数学证明的。当他检查其中的一些证明时,杜·索托伊说:“它们没有打动我。”他们没有数学家所追求的优雅和美丽。

人们很容易预测,利用人工智能来设计科学理论的尝试也会出现同样的情况。人们已经开始努力将“深度学习”方法(基本上是一种模式搜索神经网络)用于从原始数据中概括物理定律。1与人类不同,人工智能系统可以在庞大的多维数据集中感知规律。尽管如此,目前尚不清楚仅凭这一点就能超越复杂的曲线拟合。人工智能是否能够实现产生狭义相对论的想象力飞跃,或者实现如何通过自然选择的进化来解释生命的多样性?这些重要的科学思想显示了真正的创造力:能够提出推测性的、丰富的假设,其范围略超出现有的数据,并能编码数学公式无法完全捕捉到的见解。

当然,这正是我的天体物理学家同事所指望的。但人工智能可能既不会局限于科学领域,也不会对科学家的就业构成如此大的威胁。

积极的合作

首先,人工智能在艺术领域的应用已经显示出如何超越单纯的排列枚举。“对抗性”系统将解决问题的算法与使用某种标准来选择质量的算法进行对抗:这是一种针对人类判断训练的解决方案的批评。例如,这样的系统已被用于改进爵士即兴创作算法的输出。与此同时,一些研究人员怀疑,至少在短期内,最富有成效的人工智能指导科学研究的应用将来自人与机器的合作,这将发挥双方的优势。

机器学习已经广泛应用于材料科学和药物化学等领域,在这些领域,算法可以在人类永远无法处理或可视化的“化学空间”中大量高维数据中寻找结构-功能关系。2但可能性远不止这些。机器学习还可以加快文献搜索、数据分析(比如解释显微图像),甚至是实验设计,这些都可能以自动化的方式进行。3.假设-实验-改进的迭代过程可以通过这种方式大大加快。所有这些都让机器承担了很多以前要花费研究生几个月时间的苦差事。

因此,人类研究人员可以解放出来,提供机器认为更具挑战性的创造性输入:超越仅仅对数据集的推断的信念跳跃,可能会成功的疯狂直觉。但这种合作可能比呆板的机器和富有创造力的人类之间的刻板分工更为深远。音乐和文学AI系统的使用方式之一是作为原材料的来源:AI生成的掘金(主题,情节主线),经过一些质量控制后,作为新想法的种子呈现给人类。从原则上讲,如果不受习惯和偏见的影响,人工智能可能会找到新的方向或联系,然后人类可以通过这些方向或联系做出某种形状和令人满意的东西。这一过程没有理由不能应用于科学。

我的预感是,化学科学将是这种相互作用的一个特别丰富的舞台。原因之一就是高维度:化学空间中有很多自由度。但同时,化学占据了相对简单和有规律的(物理学)和令人难以置信的复杂和偶然的(生物学)之间的中间地带。它需要“足够好”的理论和概念:很少严谨,由直觉和推理形成,但对“思考”有用。深度机器学习和人类天赋的结合可能就是这方面的门票。