瑞士和美国的科学家已经开发了一个生态系统的工具来提高机器学习(ML)的有机框架设计(mof)凯文Jablonka从瑞士联邦理工学院洛桑(EPFL)和他的同事们Mofdscribe提供给用户在2022年12月,其中一些已经发表的研究利用。此工具帮助我们向前移动的速度快得多,”Jablonka说。

今天,化学家可以使数以百万计的不同财政部通过连接节点和金属有机基团分子等施工工具。科学家与一个潜在的无限数量超过100000财政部可能,使用包括催化化学反应和储存气体包括二氧化碳。

构建块化学家选择可以控制MOF的属性,这使得他们的设计至关重要。与大型化学空间探索,研究人员使用计算机设计、ML方法预测属性包括气体吸附、颜色、氧化态、热容、合成条件和水稳定性。

Featurisation

来源:©美国化学学会

Mofdscribe featurises的各种MOF特性数据,机器学习betway必威游戏下载大全系统可以用来设计新的结构。

工作在Berend SmitEPFL)的团队,Jablonka很失望,试图找出如果新的ML方法比旧的好,发现它非常困难。“这是一个非常年轻的领域,”Smit告诉必威体育 红利账户。”许多人发展机器学习方法,当然,他们都宣称这是一个进步。但Jablonka甚至不得不从头开始繁殖在Smit的小组开发的系统,因为代码没有运行。

2022年3月起,Jablonka开始编码工具毫升财政部设计的整个生命周期过程。它给你的数据,它给你工具,然后将数据转换成毫升输入,然后测试和比较模型并报告并公布结果,”他解释说。60000行代码更改后,工具成为了20000行Mofdscribe生态系统。

Mofdscribe的一个关键方面是解决问题的数据用于训练毫升系统泄漏测试集。这是一个问题,因为这就像让毫升系统考试作弊其提前给它的答案。出现这种问题是因为相同的结构可以出现在数据集多次,超过1000在最坏的情况下。这样很容易错过相同的结构进入训练集和测试集。

Jablonka因此开发工具分析数据集,甚至没有人想到需要,根据Smit。Mofdscribe还允许用户轻松地比较不同ML性能的技术,Jablonka解释道。它包括链接到公共游戏排行榜,基准的技术。

希拉Dağlar博士研究员埃文斯顿西北大学的我们,已经使用Mofdscribe后发现这件事ChemRxiv和Twitter。她说,其主要优势是使ML数据准备和清洗容易。Mofdscribe使它容易从财政部中提取特征,她补充道。betway必威游戏下载大全这提供了一个有组织的管道特别是非专业人员在ML,“Dağlar说。然而,她希望看到它集成新的ML算法,包括深度学习和补充说,Mofdscribe的特性必须保持更新,以避免其使用减少。betway必威游戏下载大全