发现新材料是解决人类面临的一些最大挑战的关键。然而,正如微软所强调的那样,传统的发现新材料的方法就像“大海捞针”。
历史上,寻找新材料依赖于费力且昂贵的反复试验。最近,对大量材料数据库进行计算筛选有助于加快这一过程,但这仍然是一个耗时的过程。
现在,微软推出了一款功能强大的新型生成式 AI 工具,可以大大加速这一过程。这款名为 MatterGen 的工具摆脱了传统的筛选方法,而是根据设计要求直接设计新型材料,为材料发现提供了一种可能改变游戏规则的方法。
微软在《自然》杂志上发表的一篇论文中将MatterGen 描述为一种在材料 3D 几何结构内运行的扩散模型。图像扩散模型可以通过调整像素颜色根据文本提示生成图像,而 MatterGen 则通过改变随机结构中的元素、位置和周期性晶格来生成材料结构。这种定制架构专门用于处理材料科学的独特需求,例如周期性和 3D 排列。
微软解释说:“MatterGen 实现了一种生成式 AI 辅助材料设计的新范式,可以有效地探索材料,超越已知的有限材料范围。”
超越筛查
传统的计算方法需要筛选大量潜在材料数据库,以找出具有所需特性的候选材料。然而,即使是这些方法,其探索未知材料领域的能力也有限,研究人员需要筛选数百万个选项,才能找到有希望的候选材料。
相比之下,MatterGen 从零开始——根据有关化学、机械属性、电子特性、磁性行为或这些约束的组合的特定提示生成材料。该模型使用从材料项目和亚历山大数据库汇编的 608,000 多种稳定材料进行训练。
在下面的比较中,MatterGen 在生成具有特定属性的新材料方面明显优于传统的筛选方法——特别是体积模量大于 400 GPa,这意味着它们很难压缩。
尽管随着已知候选人库的枯竭,筛选的收益随着时间的推移而递减,但 MatterGen 仍继续产生越来越新颖的结果。
材料合成过程中遇到的一个常见挑战是成分无序,即原子在晶格内随机交换位置的现象。在决定什么算作“真正新颖”的材料时,传统算法通常无法区分相似的结构。
为了解决这个问题,微软设计了一种新的结构匹配算法,将成分无序性纳入其评估中。该工具可以识别两种结构是否仅仅是同一底层无序结构的有序近似,从而可以更可靠地定义新颖性。
证明 MatterGen 可用于材料发现
为了证明 MatterGen 的潜力,微软与中国科学院深圳先进技术研究院(SIAT)的研究人员合作,实验性地合成了一种由人工智能设计的新型材料。
这种材料 TaCr₂O₆ 由 MatterGen 生成,以满足 200 GPa 的体积模量目标。虽然实验结果略低于目标,测量的模量为 169 GPa,但相对误差仅为 20%——从实验角度来看,这是一个很小的差异。
有趣的是,最终材料表现出 Ta 和 Cr 原子之间的成分无序性,但其结构与模型的预测非常吻合。如果这种预测精度可以转化为其他领域,MatterGen 可能会对电池、燃料电池、磁铁等材料设计产生深远影响。
微软将 MatterGen 定位为其之前的 AI 模型MatterSim的补充工具,该模型可加速材料特性的模拟。这些工具可以一起充当技术“飞轮”,增强对新材料的探索以及在迭代循环中对其特性的模拟。
这种方法与微软所说的“科学发现的第五范式”相一致,其中人工智能超越了模式识别,可以积极指导实验和模拟。
微软已根据 MIT 许可发布了 MatterGen 的源代码。除了代码之外,该团队还提供了模型的训练和微调数据集,以支持进一步的研究并鼓励更广泛地采用这项技术。
考虑到生成式人工智能更广泛的科学潜力,微软将其与药物研发进行了类比,此类工具已经开始改变研究人员设计和开发药物的方式。同样,MatterGen 可以重塑我们处理材料设计的方式,特别是在可再生能源、电子和航空航天工程等关键领域。