有机化学家应该拥抱机器学习虽然不能完全了解它的工作原理

经典,黑盒是一个系统的输入控制或已知的,和它的输出可以收获,但内部工作仍然是一个谜。谷歌搜索——我们可以大概知道它是如何工作的,但搜索算法的细节是保密的。但有机化学与计算时,我们有时会感到我们想知道一切——黑匣子可以看作是令人沮丧和不信任工具。

它是公平地说,有时候,让我们全面理解控制所有变量来避免问题。作为一名学生,我表示担忧的结果计算运动,被解雇,但计算机说这是你必须做的。三个月的辛勤工作后,我们合成化学家被证明是正确时发现系统中由于一个计算错误我们无法直接访问,我们确实一直在错误的化合物。我有一个严格的剂量的怀疑方法的控制自!

虽然谨慎是很好的建议,我们也应该记得本科热力学,当我们学会故意把化学系统视为黑盒,其复杂性减少到几个基本参数,否则我们无法计算它们的属性。最复杂的系统清楚地了解系统的工作需要足够的替代品知道确切的路径到达我们的答案。我特别想机器学习方法:系统的内容实际上不可知的,推理的人类用户可能没有意义。然而,让一个信仰的飞跃是高度不舒服为有机化学家,曾是权威和推理甚至超过原子结构。虽然我们永远持有单个神经网络的每个细节在我们的脑海里,我们可以学习他们是如何工作的,它是怎样产生的,哪些参数可以利用。工具的基本理解和信任专家合作使我们能够减少的担忧抽象方法。

抽象的艺术

在某种程度上,人类抽象的几乎所有我们使用。每当你使用一个质合成化学家,你不需要精神贯穿的基本理解的相对极性,紫外吸收和ionisability基质。仅仅指的是你的化合物作为三级苯胺提供了足够的信息对一个有经验的用户期待某种结果。这些抽象甚至可能直接硬编码;例如,您可能有极性和无极的泛型方法设置工具。有无数流行的例子更容易识别概念,我们给它一个名字——也许名字反应是一个案例,以及负面的例子,比如看到的人看起来就像一个小无赖,错误的精神连接来捣乱的行为。观众的能力抽象也是一个有用的工具当呈现复杂的结果:数据讲故事允许主持人个人砖的数据构建到概念结构,帮助观众觉得他们有更少的个人概念包装。

抽象人类non-interpretability飞跃时涉及到电脑的速度计算或太多的变量。幸运的是,电脑擅长这些,但是它可以是一个冲击时不再容纳人类大脑的方法。我想象这些超人的帮手是另一层的大脑就像一台笔记本电脑计算分摊给一台超级计算机集群,然后检索结果。

实际上我们有机化学家不能够理解一切

这是优势:某些系统我们真的不明白他们所做的比我们更好。虽然机器学习仍然是一个新兴的工具应用于有机化学,特别是由于我们相对较小的数据集,它的力量是清楚我们日常使用的面部识别我们的设备在我们家助理语音识别。(也就是说,机器学习是同样的偏见的培训:它可以过度使用催化剂,或者更令人担忧的是,斗争更深色肤色的人类图像。)以外的东西可能不清楚大公司经常是机器学习中发现有用的化学。在一天结束的时候,重要的是结果是否可证实地工作,而不是我们如何到达那里,尽管它可能难以下咽。我们必须使信仰上的飞跃和记住我们有机化学家实际上并不能够理解一切。

有机化学的著名not-so-humble世界正在被我们的自我和缺乏愿意向更高的抽象。我们可以让我们的领域更强大和更有用,任何计算化学家都会告诉你,黑盒过程不需要以整体成本的见解。