化学结构将从研究生收获和对前途的药物和材料分析工作

在上面

新项目旨在确保有机化学论文不会说谎被遗忘在柜子的后面

觉得绝大多数的信息包含在你的精心准备的论文是注定要被遗忘会熟悉很多博士生。但这可能要改变合成化学家,多亏了一组研究人员已经积累了一批数字的超过75000种化合物的博士论文,否则在默默无闻的衰退了。

努力是一个皇家化学学会的的一部分(RSC)资助的必威手机登陆试点项目建设国家复合收藏。目前的形式收集存在于网上,与RSC的化学结构存储在数据库中ChemSpider。收集还没有访问,但将被制成一个开放资源在一次创作共用许可证试点过程完成的评估过程。

“这应该是一个对任何人可用资源的工作取决于使用分子,”说蒂姆·加拉格尔布里斯托尔大学的化学教授,英国是一个项目的协调员。他解释说这个项目运作从一个小得多的计划,在大学努力的分子分子制造商与用户通过收集的数据合成化学的博士论文。

(论文)发布文件,所以他们已经在公共领域和主要IP-free,”加拉格尔说。他说,过去的努力建立一个物理的化合物可以作为一个资源陷入了麻烦,因为知识产权的问题,以及大量的工作,参与合成和组织样本。保持收集使用数据从虚拟和发表论文被周围很多这些问题。‘这是一种我们可以证明(公开资助)研究的价值,”他说。这些东西一直坐在书架上灰尘基本上,为什么不好好利用它呢?”

收集结构

收集所需的数据与15英国合作大学化学系,捐赠750合成化学的博士论文。一群11的数据收集器,由布里斯托大学的化学家劳拉广泛,经历了每一个论文,手动提取和新化学结构是无可厚非,在进入ChemSpider。这个过程仅用了四个月,从去年2月到6月。

”在这一时期他们设法收集45000种化合物,”大卫·安德鲁斯说一个行业副领导RSC的项目。使用单独的条目不同的对映体和非对映体,他解释说,一共75000个条目,其中70%是ChemSpider全新。

这些东西已经坐在书架上落满了灰尘

收集新结构是一样重要评估潜在的“有用性”集合,所以项目还包括一个虚拟筛选阶段。你可以采取一个虚拟数据库和屏幕,有趣和重要的蛋白质,所以你可以有效地看看你的分子结合[他们],”加拉格尔说。

收集筛选对32个蛋白质结合位点在学术界和产业界合作伙伴捐赠的。一些“热门”对蛋白质的目标被确定,它现在被用于这些蛋白质的“主人”。在这种情况下,团队选择关注的生物活性分子,但加拉格尔解释说他们也可以筛选有利属性在其他领域如小说的材料。

该小组还与化学信息学公司合作NQuiX评估化学“多样性”——集合内结构的独特性——被发现与其他集合相比相对较高的化合物,与大约2000高度小说结构确定。这表明,收集有潜力成为一个有用的资源。

展望未来

现在试验已经完成,团队热衷于继续项目,扩大集合。甚至有可能启动一个化合物陪数据库的物理集合,但是这条路仍然充满了问题。

你必须找到一个地方来存储,牧师,把它们放进一个格式,人们可以用它来分配,所以下游有各种各样的问题,”加拉格尔说。不管这是否能继续,他补充说,维护一个虚拟数据库仍然有价值。任何物理集合将仍然需要存在于网上。但在硅(集合)不需要物理,至少不是马上。他们可以并行。

人们花了很多时间收集这些信息,你打算怎么处理它

但并非所有人都认为扩大收集将是值得的。这是一个好主意让这一切在一起但真的是如何工作的呢?说保罗·怀亚特英国邓迪大学的化学家,他并没有参与这个项目。人们花了很多时间收集这些信息,你打算用它做什么,它添加什么?是花钱的最好方法吗?”

但加拉格尔认为在硅片上的潜在扩大集合是一个宝贵的机会,不应错过。”的确,筛查项目由制药公司需要实物样品,”他说,“但是我们的预测能力使用电脑只会变得更好,所以我不认为你能减少硅资源的价值。将来”,他补充说,博士生可以鼓励进入自己的结构数据集合,因为他们写他们的论文。“那么你经常添加到集合。

飞行员是一个概念验证,检查的结果是正面的。我们有信心,我们可以把这个工作,”安德鲁说。集团生产的飞行员报告将于今年出版。然后他们就可以开始计划下一个阶段。

我们只是触及了表面的论文数量的坐在那里,”加拉格尔说。这是一个巨大的机会来展现英国化学的影响。