充分探索海洋的化合物——甚至计算——是不可能的,发现菲利普球

化学有多大?我并不是说它有多重要,或有多少人,而是有多少分子,我们可以做什么呢?答案是,第一个近似:不要问。可能的分子排列的所有元素的数量似乎并没有被估计,可能不是一个有意义的概念,但即使我们限制自己的小有机分子(低于70原子)可能表现出毒品活动,这个数字是1060。我们还没有做任何的希望超过极小的一部分,目前最大的公共数据库的分子合成,PubChem,包含了大约50个数量级少(7000万年~)。你的数学。

这里我们看到的是化学空间,实际上它一样巨大的宇宙。我们永远不会去探索多一些小角落。我们应该如何阻止?也许这里是数不清的财富,我们永远不会找到吗?或者可能我们已经生根在最肥沃的土地?

药物发现是最突出的领域,这样的问题是紧迫的,但并不孤独。谁知道非凡的材料可能就潜伏在化学空间——毕竟,仅仅十年,我们一直在了解潜在的可能的最简单的一个材料,纯形式的结晶碳石墨烯。染料、电池、催化剂、溶剂、食品添加剂等,没有一个单一的化学领域可能不是由我们跌跌撞撞地进入一个新的地区丰富的化学空间。即使我们的旅程注定永远保持选择性和狭隘,我们至少可以找到导航手段,引导我们进入更有用的领域?或失明,随机搜索最好的我们可以做吗?

许多研究人员相信,这不是,他们是设计计算和实验工具来帮助我们做得更好。虽然这些可能带来实际的回报,他们也让我们提出一个更广泛的问题:我们是否可以开始察看化学空间本身的轮廓?我们知道它是什么样的空间——一个统一的平原,说,还是崎岖的山区?它实际上是值得探索的多少?

发现新的药物

制药业应该首先解决化学空间不足为奇。首先,我们迫切需要新的药物:越来越多的没有批准之前,一些人担心,管道运行干。一些研究人员认为,我们只会找到新的大幅扩大搜索。

但到目前为止,组合库的小分子-由随机选定的组件装配还没有证明非常富有成果的来源的分子从药物开发的新线索。也许这并不奇怪,即使在这里管理选项的范围太大。彼得Ertlchemoinformatics专家诺华制药在瑞士,估计,大约有1020.-10年24“药物样”包含30原子的有机分子,仍有太多的计算搜索,更不用说让使用组合合成和筛选。所有合成的努力到目前为止只是皮毛,”Ertl说。

蒂娜Zellmer /首次艺术

多远,蛮力搜索可以吗?jean - louis Reymond伯恩大学在瑞士是最刻苦的制图者的化学空间。他和他的同事开发了计算的方法列举所有可能的分子一定规模,1和迄今为止收集的数据库大约1660亿17个原子的分子含有碳,氮,氧,硫和卤素GDB-17 Reymond调用。

Reymond和他的同事们使用图论枚举所有可能的饱和烃网络的大小。然后他们变异和functionalise这些骨架通过添加双键和三键或杂原子氮、氧、硫和卤素,观察化学价规则。一路上算法使用一些化学常识来剔除分子太紧张或活性稳定合成。事实上,更多的限制性规则用于生成GDB-17实际上比化学家使用——只有57%的所有的分子的大小和构成PubChem都包括在内。

有多少这些分子可能与药物相关的发现呢?为了回答这个问题,你需要通过电脑屏幕候选人,因为他们都是不可能的。但可靠的仿真方法,可以预测,说,小分子的亲和力等药物的目标酶仍很难设计。所以Reymond搜索从我们所知道的:他们浏览尝试和测试的地方。在我们的方法,我们总是从现有的分子有一组特定的可取的属性:物理、生物、之类的,”他说。的想法就是搜索化学空间具有类似性质的其他分子。

以系统的方式,这将是很好的组织这个巨大的一些方式,多维空间,这样分子具有类似属性可以被组合在一起,元素周期表组织元素。注意,类比,Reymond提议使用“分子量子数”的分类方案(MQN)。这些数的分子很容易看到,如原子、债券、周期等,“Reymond说。“因为我们计数的东西给整数值,我认为这是优雅,也基本上正确的调用这些分子量子数的。尽管简单,但MQN系统不仅是优秀的分类和可视化虚拟筛选,特别是寻找形状和药理活性的化合物的类似物。Reymond的小组已经发现了一些有前景的新候选药物的化学空间。

遵循自然

有更多的多样性比PubChem GDB-17数据库框架。但是这化学物质空间的多样性,如果只有某些类型的分子是有用的吗?试图找出如果是如此,Ertl和同事在诺华公司着手研究分子的一个小子集:那些包含简单的芳环系统。戒指是非常普遍的已知药物支架——Ertl的分析表明,超过96%的目前已知的生物活性分子的典型示例包含环,其中75%被芳香。(相比之下,大多数天然产物环系统是脂肪族-只有38%是芳香。)但令人惊讶的是,只有一个非常小的许多不同的支架在目前已知的生物活性分子。简单的芳环结构——那些有1至3个融合五或六元环——只有780类型出现在大约150000生物活性结构,且仅10中超过1%的人。

生物活性位于一些小岛屿在巨大的化学空间

探索为什么这可能是,看看这个生物活性分布在这部分的化学空间,Ertl和他的同事们绘制了简单的芳环系统使用一个算法依据基本的化学规则产生的所有合理的化学结构和排除那些被认为“太异国情调”。他们的方法识别分子大约有580000,其中只有2000人左右了。2然后他们使用神经网络算法训练中寻求生物活性可能的结构。它发现完整的空间内只有几个小岛,局限于几个骷髅喹唑啉和嘌呤等。

换句话说,Ertl说,已知的生物活性位于一些小岛屿在巨大的化学空间”。他说,所以,最好的办法找到新的有用的化合物是不枚举整个空间,但使用算法训练发展分子是已知生物活性的相关网站。但他警告说,这明显稀疏的生物活性化学空间可能部分由于这样一个事实:我们只看几个地方:可能有其他生物活性的岛屿,神经网络不捡,仅仅是因为它没有理由期待它。

限制我们的经验可能会改变,Ertl说,由于一项新兴技术,可以改变我们的方式探索化学空间,称为DNA-encoded库。3每个分子片段编码有一个独特的DNA序列,所以分子由他们组合洗牌可以快速识别和筛选。这项技术允许一个创建和随后屏幕上巨大的库(数亿甚至数十亿)的分子,”他说,整个图书馆是包含在一个单一的管。在几年内,我们将看到这种新技术是否持有的承诺,”他补充道。

建筑脚手架

赫伯特Waldmann马克斯普朗克研究所分子生理学在德国多特蒙德,同意探索化学空间有效药物发现,我们需要一个导游。就像Ertl(两个合作)他建议我们应该从分子已经开始显示,活动,寻找那些结构相关。但是而不是使用机器学习方法进行搜索经验,他认为它可以更系统的:我们应该寻找一个分子的“核心”定义的化学行为和基础我们的搜索。天然产物似乎是如何运作的:他们倾向于分享数量有限的基本支架。“大自然发明了一种解决方案,然后完成不同的功能,不同的Waldmann说。“一直都没有彻底改造”——我们不应该。

Waldmann和他的同事们试图将这些天然产品内核使用一套规则安排许多小有机分子在自然界发现的树结构类型、层次结构的每一层作为一个细化的几个基本核心。这种所谓的天然产物结构分类树(SCONP)漏斗减少到三个基本的“树干”:周期的碳,或包含氮或氧杂环化合物。4

蒂娜Zellmer /首次艺术

没有理由我们的药物必须局限于结构性质用途,然而。Waldmann和他的合作者已经开发出一种方法叫做Bios(面向生物合成),扩展了SCONP树包含已知的合成分子显示相关的生物活性,使用一组给定的分子相关的规则,其核心脚手架以及发布信息分子的生物和医药的影响。5规则用于构造Bios树在某种程度上是任意的,所以不同的规则会给不同的树木,但任意给定的一组规则,Waldmann说,可能选择跟踪特定类型的生物活性有关。

这种方法是有用的显示什么样的核心结构分子应该为了显示特定的生物学性质。但真正聪明的是,研究人员发明了一种算法,称为脚手架猎人,可以在地图上标出“失踪”部分的Bios树:分子和家庭的分子也属于特定分支但它还没有被制造或测试。6”这样的虚拟化合物可以——或者更好的是,购买——他们应该分享预期的活动,“Waldmann说。

他们做的事。在一个例子中,从PubChem Waldmann和他的同事使用数据构建一个Bios树为活化剂和丙酮酸激酶的抑制剂,参与糖酵解酶。这包含超过35000个不同的支架,它没有合成的四分之一。通过专注于那些分子附近的邻居知道有这个活动,研究者缩小他们的选择四个新的支架,制造或购买了107的衍生品和筛选他们找到九催化剂和抑制剂具有良好的活动。所有这些满足其他条件(如溶解度)好所需药物。

Ertl相反的建议,一个特定类型的生物活性是局限于小岛的空间,Waldmann说化学空间非常丰富的生物活性化合物,并通过空间——这些都是高度分散他们不是相当罕见,集群子集可能的原子排列。有结构核心完全不同的化合物可以显示相似的关联绑定到单个目标和引起相同的生物反应。这听起来像个好消息药物猎人。但诀窍是找到如何定位和追求正确的网络通过一个密集的网络结构的其他网络。

空间以外的药物

虽然药物发现主导化学空间的探索,它不是城里唯一的游戏。另一个领域的分子性质决定的有用行为均相催化物质。这些催化剂有机金属配合物,设计或优化催化剂为特定的功能通常是找到合适的配体与金属中心坐标。配体对催化活性的影响可能取决于几个功能,如它们的大小,形状和电子性质:多少电子撤出或捐赠给金属中心说。betway必威游戏下载大全

我们还没有计算之前经常能来实验

娜塔莉Fey,目前的客座研究员布里斯托大学在英国,和同事发现,像这样的简单特征的线性组合作为预测的催化活性,崩溃的多维化学空间磷捐赠者配体在低维的地图。betway必威游戏下载大全这些组合的统计方法叫做主成分分析。主成分代表的轴地图本身没有一个简单直观的解释,但他们提供了一个易于形象化的方式分类为大约350种已知配体配位体属性类型,从而简化计算搜索潜在的新催化剂。7

这样的模块化特征有机金属化合物-加配体金属中心允许一个理性的方法建立有意义的图书馆计算,维大詹森卑尔根大学和他的同事已经发现。8他们开发了一个算法,将已知的化合物分解成基本片段使用一组“bond-cutting”规则,考虑“retrosynthetic推理”——分子实际上是如何组合在一起的。然后他们使用这些片段来建立一个新的化合物库,不仅是更现实的和稳定比简单地观察化合价的法律,但也更容易合成。

Fey说,在有机金属催化,或许在无机化学更普遍的是,最大的激励因素之一是找到替代化合物将工作以及已知变异没有成本或毒性等缺点。这是说,你想要一个分子的相似但没有问题。一旦我们知道催化转换是可行的,改变配体在金属中心是最常见的方法来调整催化剂活动或选择性,”她说。

但选项也是巨大的,所以计算筛选化学空间可能是必不可少的重点实验在正确的方向上。都是一样的,垂死的承认,“我们还没有点计算实验之前经常能来。”

鉴于到目前为止的进展,然而,这个目标看起来不仅可行,但不可避免的。它不是纯粹的幻想想象拨号在属性你想从一个分子生物活性,催化特异性、光学行为,你的名字,电脑扫描后化学空间给你少量的候选人。那么你可能会变成这样的设施Dial-a-Molecule方案正在开发的英国工程和物理科学研究委员会,让他们为你自动合成,由邮购给你测试。

这个自动化的化学发现将化学的神秘和艺术吗?或者,就像自动行星的太空任务,打开我们的眼睛的意想不到的奇迹呢?

菲利普球总部位于英国伦敦,是一个科学作家吗