计算将帮助用户认识到当他们需要训练一个神经网络

美国的研究者们已经开发出一种更好的方法来衡量神经网络预测的信心。当我们想出去发现新材料,最大的挑战之一是我们如何知道我们信任模型,”说希瑟Kulik来自麻省理工学院的领导了这项研究。”这是延伸在化学发现挑战,这是我们工作的重点,到其他领域,如图像识别或其他机器学习的应用程序。

神经网络模型模拟大脑如何和处理数据。网络的虚拟神经元响应输入的不同特性,例如一个分子的连接,大小和电荷。betway必威游戏下载大全这些神经元通常组织层,一层的输出提供了一个更精致的输入下,直到最后一层的输出是加工成结果,如化学性质。网络训练一组著名的例子是通过修改神经元的反应,直到它给出了正确的答案,之后,它将充分预测新数据。

图像显示紧缩政策潜在的距离被切断系统可以降低误差低于训练误差预测模型,从而使预测误差控制在化学发现或识别有用的数据点为主动学习

来源:©Heather Kulik /麻省理工学院

收紧潜在的距离被切断系统可以降低误差低于训练误差预测模型,从而使预测误差控制在化学发现或识别有用的数据点为主动学习

新Kulik和她的研究团队观察了这些预测的信心是测量。其中的一个方法是测量之间的变化预测模型非常相似,例如在一个训练在一起,或一个网络连接随机辍学。当模型不同意这意味着没有一个模型真的知道答案,“Kulik解释道。另外,它也可以认为模型不会和一个输入工作非常不同于数据训练,可以表示为特征空间中的距离(即两个点在一个分子表示)之间的区别。与其他方法不同,计算这是便宜的,因为它不涉及重新运行或再培训模型。然而,它只适用如果描述输入的特性密切相关的属性被预测。betway必威游戏下载大全异同在无关紧要的功能可以使一个分子看起来接近或进一步的训练数据可能并不是这样。betway必威游戏下载大全

Kulik集团意识到神经网络账户,编码一个更相关的描述分子的最后一层神经元输出之前,被称为潜在的空间。神经网络本质上是做什么是剥离了细节的功能不是有用和放大最重要的,和我们的潜在空间,它基本上是模型的方式看到分子预测,“Kulik解释道。betway必威游戏下载大全在这个空间的距离就可以作为一个更好的衡量不同的给定的训练数据的输入。我们有谈论点移动在训练和如何通过模型的层,这可能是一个更高的保真度或更好的方法理解模型了解一个新的分子。这是非常直观的一旦我们登陆它。”

图像显示潜在的空间距离,提出了另一种不确定性度量蒙特卡罗辍学,整体模型和特征空间距离

来源:©Heather Kulik /麻省理工学院

潜在的空间距离,提出了另一种不确定性度量蒙特卡罗辍学,整体模型和特征空间距离

给潜在的空间距离比整体更准确的估计的不确定性,退出和特征空间技术在两个完全不同的问题:预测spin-splitting无机复合物,有机分子的世界里的能量。它甚至给了有用的结果,当检测图像识别问题。这潜在的空间距离是神经网络的基本性质不依赖于底层应用程序,”笔记克Corminboeuf理论化学技术发展,瑞士联邦理工学院洛桑(EPFL)。“并不是所有的机器学习模型中使用化学是基于神经网络。然而,这种方法将激励使用类似的指标。”

一个新的程序

了解一个模型有信心可以帮助完善它。例如,它只能在它执行的地区重新训练,专业但可靠的工具。另外,培训可以专注于模型是较弱的地区,使其更普遍。潜在的空间测量给出更好的结果在这两种情况下,和它的效率,尤其是合奏方法相比,在自动化主动学习是一个优势。之间“你想要一个相当紧密的循环找到确定的点,训练模型,然后重复这个过程很反复,“Kulik说道。

测量的重要性化学模型的信心可能还没有被广泛赞赏。如果你看看文献,,这种情况并不少见,人与机器学习模型作出预测或使用它们没有真正了解模型将如何工作,以及一个模型将概括,“Kulik说道。Corminboeuf说类似的事情:“评估与预测新的分子或构象相关的错误显然没有例行程序,但不确定性指标来评估这些预测的可靠性至关重要。他们将和应该使用越来越多。