了解机器学习预测探索这条路而不是旅行

机器学习方法可以有效地解决复杂的问题,通过训练模型已知的数据,并将这些模型应用到相关的问题。但是理解为什么模型返回一个特定的结果,这是至关重要的验证和应用这些信息,通常是在技术上具有挑战性的,概念上的困难和模型相关。现在,一个团队在美国从事可辩解的AI化学已经开发出一种方法,产生的反事实的分子作为解释,可以灵活地在不同的机器学习模型。1

已经有一些高调的事故在计算机科学中,一个模型可以预测的东西很好,但是没有任何有意义的基础上,预测的解释道安德鲁•白罗切斯特大学的,他的团队开发了新的反事实的解释方法。有时(机器视觉模型)预测,有一匹马,不是因为有一匹马,但因为有一个摄影师的水印。失踪的一匹马的照片显然是低风险的,但是如果你试图预测如果是致癌的有毒或易燃的东西,然后我们开始遇到更严重的问题。的理解,一个模型是否已经达到了正确答案错误的原因——被称为聪明的汉斯的效果数学天赋后马——是可辩解的人工智能的目标之一。2

反设事实是一个直观和丰富可辩解的人工智能方法。对于任何特定的预测,例如,输入分子可溶性,反事实的是最类似的例子,该模型给出了一个不同的预测。通过对比的改变,例如羧基的损失导致化学活性的改变,让你“学习”为什么模型预测,“解释道金正日Jelfs研究在计算材料发现伦敦帝国理工学院,英国。这是本质,而化学家的令人满意的方式来了解机器学习模型是有效的。如果模型的表现,这种不切实际的本身也是一个有用的预测。一种反事实的解释是可行的,它告诉你如何改变你的分子改变自己的行为,”笔记白色。“这是给你一个真正的分子可以合成和测试。

一种反事实的解释是可行的

然而,寻找一个反事实的仍然通常取决于所使用的特定的人工智能模型的微妙之处。假设您正在使用一个图形神经网络,“说Geemi Wellawatte,研究员白色的团队。你需要特别注意,因为您正在使用图形,而不是一个字符串表示(分子)。其中大部分可辩解的人工智能方法对模型非常敏感,和你的方法的缺点是不能应用在一般情况下,不管它有多好。寻找最相似的分子也是独特的挑战。的导数的分子结构是一种非常奇怪的概念和数值非常困难,”解释了白色。

不遗余力

答案是使用一个简单的方法来做出类似的分子。白色的学生Aditi瑟哈德里建议他们尝试用石头打死,超高速的遍历,优化,新奇、探索和发现方法在加拿大多伦多大学的发展,产生一个分子的化学邻国通过修改Selfies字符串来描述它。3“这是这样一个简单的方法来使用:没有衍生品,没有GPU,没有深度学习。这只是字面上修改字符串,“白色激动地说。

这个想法导致团队创建Mmace——简称分子模型无关的反事实的解释。Mmace需要一个分子和使用一个调整用石头打死搜索构建图书馆类似的分子。这些可以通过机器学习模型筛选分子给不同的结果,和Tanimoto距离显示最相似。

计划

来源:©安德鲁白色/罗彻斯特大学

方法通过扩大空间周围的分子预测工作。它能够识别相似的分子改变预测(反设事实),然后选择少量的这些分子反设事实

作为Mmace不依赖于机器学习模型的内部结构,很容易实现和广泛适用的。”很多时候在机器学习的研究中,研究者们可能更愿意改变他们的使用取决于模型数据可用性或特定的财产被预测,“解释道希瑟Kulik化学工程师在美国麻省理工学院的化学研究机器学习。一个方法模型的可解释性,适用于多种类型的机器学习模型将确保其广泛的适用性。“方便Mmace Jelfs也高兴。他们提供方法开源,其他人可以立即用它来解释自己的深度学习模型。他们的方法可以应用于任何机器学习模型,所以它是立即社区中非常有用。

白色的团队测试Mmace跨各种化学问题和机器学习模型,包括艾滋病毒与图像卷积网络活动预测,递归神经网络和溶解性,在每种情况下获得反设事实帮助证明原分子的性质。你怎么证明你已经成功了吗?“奇迹白色。我们试图从很多不同的角度看这个,但在一天结束的时候,“一个有效的解释是什么?”是这样一个模糊的概念,我们正在与一位哲学家。

在社区立即很有用

白色是热衷于强调Mmace不是灵丹妙药。Selfies难以代表等类的分子和结合有机金属结构如二茂铁,虽然所有Selfies字符串满足某些标准化学意义——原子的价,例如——不是所有Selfies结构必然是synthesisable分子。解决后者,白色的团队尝试PubChem数据库相似性搜索的实验报道分子产生化学邻居,而不是用石头打死。这给反设事实,更不同于原来的分子,但它仍然提供有用的见解:修改在叔胺分子移除它预测渗透血脑屏障的能力,这意味着组织允许分子交叉。

白和他的团队正在继续工作的细微差别的方法,如分子相似性的定义。也许一个有机化学家认为,”我可以合成这一途径,然后如果我做一点改变,我可以合成这一个,所以他们可能一步,”“白解释道。我们也用同样的工具创建的解释,但试图归类这些类似的分子机械的解释。我们喜欢交流的想法只有化学结构解释,像反设事实,但在某种程度上,我们需要调整我们的心智模式的解释为什么一个分子或不工作。