一半左右的人类蛋白质是一个谜。它们看起来像什么,问菲尔球吗

科学是完全的黑暗。当你开始欣赏我们不知道多少,令人惊讶的是,我们所知道的。尽管冥思苦想,许多复杂的实验,我们还小关于暗物质的智慧,我们相信超过可见物质在宇宙的五倍,更不用说暗能量组成的能量密度超过三分之二的宇宙。还有“暗物质的基因组”:99%的DNA,我们不明白。

现在光照射到科学的另一个黑暗角落,只是亮足以显示出巨大的一个洞。根据去年发表的一项研究由肖恩·唐格,生物信息学专家Garvan医学研究所的悉尼,澳大利亚,和他的合作者,大约一半的蛋白质序列在像我们这样的“高级”真核生物——包括大约每六整个蛋白质分子——是一个谜。这是黑暗的蛋白质组。

“黑暗的蛋白质是我们一无所知,”在加州斯坦福大学的迈克尔·莱维特说,2013年诺贝尔化学奖获得者在蛋白质结构。他解释道,这不仅意味着我们不知道蛋白质是什么样子或者什么,但我们不承认它是类似于蛋白质,我们了解的。唐格的团队试图评估,然而,我们可以说对这些黑暗的蛋白质。的第一件事就是:有很多。

我们的工作并不能解决问题,而是它开辟了一个新的领域,“唐格说。每次我与他人讨论,人们问“如何影响我的工作吗?“这黑暗的一部分我们的生物化学,他说,是“众所周知的潘多拉的盒子”。

打开潘多拉的盒子

黑暗生物并不是什么新鲜事。这是长久以来人们都知道,我们的基因组具有未知函数。只有百分之一的DNA -包含约20000个基因编码的蛋白质。其余的我们很少知道直到最近,这是通常被认为是“垃圾”:叙述的数十亿年的进化,比如老被废弃了的基因,病毒和其他病原体寄生DNA插入,绵延的碱基对,复制和繁殖为了自己的生存。

但是一些非编码DNA显然是至关重要的。它编码生物相关的信息,虽然这并不被翻译成蛋白质。相反,它只是转录成RNA分子,调节蛋白编码基因的活性。直到最近,常见的观点是,虽然这监管RNA基因组的活跃和重要的产品,它来自只有一小部分的非编码DNA,而其他细胞无显著作用。它仅仅是复制和传递“盲目”当染色体复制。

黑暗蛋白质- DNA放射自显影图/人类图概念艺术作品

来源:©迈克米勒/科学照片库

所以它是一个打击,在2012年,一个国际项目编码发现大多数——高达80%——我们的DNA被转录成RNA。为什么细胞消耗的能量需要这样做,除非有充分的理由?编码团队提出,也许几乎所有这一被转录的基因材料是功能,即使我们不知道是什么目的。

索赔引起了争议,有些苦。一些生物学家说,编码团队没有提供有意义的“函数”的定义,这也许只是简单的细胞DNA转录机械不分青红皂白地而不是有精心设计的方法标明需要变成了RNA和什么没有。

不管答案,发现提醒研究者,有更多比他们预期,这可能是明智的把大部分的基因组无用的垃圾,只是不如“黑暗”,与未知的属性或目的。

发现添加到越来越多的认为遗传学的传统模式需要复议。在那幅画,身体的化学是由蛋白质编码基因和翻译策划通过RNA信息单向流动。虽然我们已经知道自1960年代以来,基因是由其他基因的动态网络交互,发现通过人类基因组计划,我们只拥有20000左右的蛋白编码基因——比预期要少得多——表明,大量的基因功能和活动必须来自一个复杂的基因网络的交互作用,而不是从简单的制造蛋白质。

都是一样的,蛋白质本身似乎相对容易理解的部分。它们的氨基酸链加入特定gene-encoded序列,有时通过共价键交联,折叠成特定的形状由于氨基酸残基之间的相互作用和与周围的溶剂。那形状决定了生物功能,通常是作为一个高度选择性的一些生化反应的催化剂。

因此,DNA和RNA可能是参与一个复杂的和仍然相当神秘的舞蹈,至少我们知道蛋白质,对吧?

不是真的。首先,事实证明,通常是没有简单的对应一个编码基因和蛋白质。每个基因都是做成很多蛋白质变异,”奥说。

这部分是由于DNA编码序列不是连续字符串的代码。被翻译成蛋白质的序列,称为外显子,称为内含子序列分布,相应得到转录成RNA分子,但然后剪掉出前核糖体RNA是翻译成蛋白质,细胞的蛋白质合成器。外显子拼接在一起,但并不总是以同样的方式。

拼接的平均数变异的蛋白质约20 - 40,“唐格解释道。为什么所有的冗余?我们真的不知道功能变体。“更重要的是,许多蛋白质被修改以某种方式被翻译后,例如添加non-peptide化学组。所以细胞比他们有更多的蛋白质编码基因。

我们决不知道所有这些蛋白质是什么样子的。只有4%的所有人类蛋白质实际上已经结晶,这样可以推导出其结构衍射实验。这部分是因为并不是所有蛋白质结晶。使蛋白质晶体本身的“黑色艺术”,很多人拒绝玩球。一些蛋白质不溶性,因此不适合晶体生长技术,往往因为他们执行嵌入膜生物角色,所以研发表面,使其与膜的脂肪内部兼容。

只有4%的所有人类蛋白质实际上已经结晶,这样可以推导出其结构衍射实验

其他蛋白质不会包整齐在晶体因为其内在的分子结构本身就是无序。共同的想法,蛋白质折叠成紧凑而固定的球状形状(酶)或串成纤维形式(如角蛋白和结构蛋白丝)被发现近年来挑战许多本质上是无序的,而宽松的和可变的形状。没有比你更具体化他们可以橡皮筋堆叠在一起。

“内在无序蛋白质,改进和扩展了对蛋白质结构和功能是相关的,”耶鲁大学的马克bioinformaticist格斯坦说,首席研究员编码项目。这些蛋白质通常假设定义结构只在绑定各种互动合作伙伴。”

晶体学并不是唯一解决蛋白质结构的方法。他们有一些形状推导出其他技术,如电子显微镜、核磁共振光谱学。许多其他的结构可以推导出间接地通过计算机模拟,比较他们的氨基酸序列与蛋白质与已知的形状。由于这样的建模,略高于半数的人类蛋白质结构或多或少。

但是还剩下将近一半不:黑暗的蛋白质。他们喜欢什么?

探索黑暗

你怎么发现的东西你看不到吗?你可以通过消除东西。奥多诺和他的同事们最近开发了一个基于网络的公共工具称为水族馆,可以采取任何蛋白质序列,寻找与蛋白质序列同源性-火柴或接近的蛋白质数据库(PDB),全球对蛋白质结构的存储库。他们用它来扫描所有大约546000项在蛋白质序列数据库称为Swiss-Prot,手动策划,以确保一个高蛋白质序列对应于真实的可能性。如果水族馆未能找到匹配PDB, Swiss-Prot序列被归类为黑暗。

黑暗的蛋白质- DNA放射自显影图

图片来源:©Tek /科学照片库

根据这个定义,“黑暗”一种蛋白质可以发生在任何规模。我们可以了解这一结构的一小部分,大部分或全部。许多蛋白质序列有一个小的黑暗,但是大约15%的Swiss-Prot数据库对应完全黑暗的蛋白质。分布并不是光滑:黑暗蛋白质往往有小片或信封整个分子,很少有中级水平的黑暗。

真核生物,大约44%的Swiss-Prot数据库对应于黑暗的区域,还有52%是“灰色”,只有PDB近似匹配。只有4%是“光”,给一个精确的匹配。细菌和古菌的比例要小得多,只有14%左右的黑暗,但对病毒与真核生物。

小片未知结构的蛋白质是没什么大不了的。它是完全黑暗的蛋白质,是最大的难题。为什么还没有他们的结构推断,他们会是什么样子?

也许结构测定受到障碍?事实上,研究人员发现,大约三分之一的黑暗的蛋白质是无序在某种程度上。这意味着我们已经相当的偏见观点从选择效应参与蛋白质结构测定:我们倾向于研究这些结构高度的纯粹因为这些都是我们可以学习的。蛋白质酶的形象精心雕刻的分子机器,然后,会误导人。有些是这样的,但其他人则软盘,软的机器——如果他们甚至“机器”。

也许有更多的比我们认为的膜蛋白,这总是很难学习?嗯,并非如此。只有大约10%的暗蛋白质组膜蛋白的特征。betway必威游戏下载大全

内在无序蛋白质和hard-to-crystallise膜蛋白的蛋白质组的“已知的未知”。但是其余的未知的未知,构成大部分黑暗蛋白质?奥多诺和他的同事们推断,与普遍的看法相反,它们是有序的,球状。”最“轻”(已知)蛋白质的结构,它被认为暗蛋白没有被认可,因为他们是无序,”莱维特说。但恰恰相反,他说,奥多诺和他的同事们的工作表明,黑暗的蛋白质序列,就像正常蛋白质的光。

尽管是球状,他们看起来不像任何其他蛋白质。这本身并不奇怪:如果他们这么做了,那么我们就会可能已经能够计算出结构,所以他们不会黑暗。都是一样的,它表明,我们到目前为止只有相当有限的样本与蛋白质的结构类型可以采用。这些教科书的例子阿尔法螺旋桶,β褶板等等,可能不是蛋白质是什么样子的,蛋白质我们看了是什么样子的。有系统的蛋白质结构,我们就不知道,“生物信息学专家安德里亚Schafferhans说德国,慕尼黑工业大学的合作与唐格工作。

这些黑暗的蛋白质也以某种方式化学改性后翻译。

不过,什么黑暗的蛋白质会怎么做?一些线索可以收集通过观察这些蛋白质驻留的地方。它们不是均匀分布在整个细胞的不同部位,但在有些地方比其他更常见。有相对较少的细胞液体或细胞质,许多球状酶做他们的生意。但很大一部分似乎注定要生活在细胞外。许多与分泌腺体或细胞外空间的组织,建议一些可能防守代理人对细菌等外部威胁。这些黑暗的蛋白质也以某种方式化学改性后翻译。

格斯坦认为,恰恰这些特性可能会让这群黑暗蛋白质很难研究betway必威游戏下载大全。可能是转录后修饰,这些蛋白质的可能性是细胞外环境的优化,使得他们顽固的蛋白表达系统或结晶技术所必需的蛋白质结构的决心,”他说。

另一方面,黑暗中蛋白质的角色在细胞外结构研究可能只是降低了他们的吸引力。“我可以想象,因为分泌蛋白与生物在细胞外产生更多的互动,他们可能已经少了一个关注的焦点结构的决心,“说Schafferhans——可能有倾向于看细胞的蛋白质“管家”。但任何它们所在的解释只是猜测到目前为止,她警告说。

光隧道在进化

所有这些都是特别有趣的从进化的观点。蛋白质,就像生物一样,是由进化。他们往往是很好的解决进化问题:有形状的氨基酸链折叠塌实,能高效、稳定,(酶)的情况下可以绑定和改变他们的目标。蛋白质,像生物,进化——经常从别人不同的性质和结构,蛋白质通过小,与一个函数可能演变随机突变成一个完全不同的功能,但类似的结构。蛋白质,像生物一样,可以安排在进化树。

但黑暗的蛋白质似乎不成为家庭的一部分。说很多人进化的孤儿,唐格——他们似乎没有任何明显的与其他蛋白的关系。一定会如此定义:蛋白质是“黑暗”,正是因为他们不能匹配已知的同系物。如果你去钓鱼的东西你不承认,当然你钩会不同。的一个挑战是找出多少黑暗中蛋白质组目前构思有偏见的方式建设。

都是一样的,很明显,许多黑暗的蛋白质不是一些古老血统的后裔,但新人。这表明他们是进化实验。《黑暗蛋白质组可以尝试新的折叠的进化的操场上,“唐格说。

可能需求转变思考什么进化在细胞和分子水平。也许是活力与创造力远远超过我们给它的功劳,积极推出新分子变异而不是依靠逐渐漂移的被动的基因突变。记住,黑暗中蛋白质组不是,总的来说,由于未知的基因:这些蛋白质是由基因序列中的信息的重组。你可以说有更多比你想象的在进化过程中从一个检验的基因组。“蛋白质重组似乎发生了以更高的速度比我们想象的“唐格说。

黑暗中蛋白质组可以尝试新的折叠的进化的操场

最终希望特别有用的变化得到固定在基因水平。但是它不必在这变化的开始。更重要的是,生物不必如此依赖的分子进化传统曲目。唐格认为所有生物可能有独特的蛋白质的一个重要部分。

“暗物质的蛋白质组的进化约束比蛋白质组的其他部分可能表明,在更少的选择,”格斯坦说。”这也许是,因为它是更灵活的结构,而且在某种意义上更灵活的适应各种氨基酸变化与结构僵化和固定部分结晶蛋白质组。这增加了动力的基因组学作为一个更多变的事件比建议的旧画相同的蛋白质从一个固定的基因模板批量生产。

格斯坦觉得黑暗的蛋白质组研究打开了一系列有趣的问题。例如,尽管已知细菌有较小的黑暗比真核生物蛋白质组,有一个巨大的黑暗微生物unculturable细菌。可能更充满黑暗的蛋白质——也许有用的吗?

和我们如何?“人类如何黑暗与真核生物蛋白质组比较作为一个整体?格斯坦的奇迹。多好,真的,我们知道自己吗?

菲利普球是一个基于科学作家在伦敦,英国