在化学的微观世界里,过渡态(TS)就像化学反应中的「能量高峰」—— 当分子们为了发生奇妙的化学变化而剧烈碰撞时,必须跨越这个转瞬即逝的能量顶峰。然而,这个关键的中间状态就像闪电一样难以捕捉:实验仪器的「快门速度」跟不上它的变化节奏,而传统的量子化学计算方法又如同用慢镜头拍摄烟花,即使是最强大的超级计算机,解析一个过渡态的结构也可能需要连续工作数小时甚至数天。这种困境让科学家们在探索复杂反应网络指导化工生产、设计性能更优的催化剂时举步维艰。
图 1:二维势能面上的反应物(R),过渡态(TS),产物(P),以及最小能量路径(minimal energy pathway)
近日,深度原理 Deep Principle 联合佐治亚理工大学,康奈尔大学等机构联合提出了一种革新性的过渡态检索方法——React-OT,采用最优传输(Optimal Transport, OT)的方法,从反应物和产物的结构插值开始,推导出高度精确的过渡态结构,相关成果已作为封面文章发表在《Nature Machine Intelligence》上,同时 MIT News 也对文章的第一兼通讯作者,深度原理 Deep Principle 的创始人兼 CTO 段辰儒博士进行了专访报道。

本文将带你深入了解 React-OT 的核心原理、与传统方法的对比,以及它如何突破计算化学的瓶颈,大幅提升 TS 搜索的效率与精度,为反应机理研究和催化剂设计提供全新工具。
一、方法创新
🔍从 OA-ReactDiff 到 React-OT
OA-ReactDiff 是深度原理 Deep Principle 于 2023 年推出的首个生成 3D 化学反应的扩散生成模型,这项成果已在《Nature Computational Science》上发表,并被选为封面论文,当时 ScienceAI 也对该成果进行了报道。
OA-ReactDiff 仅依赖反应物和产物的 3D 几何形状即可生成过渡态结构,比传统量化方法预测过渡态速度提升 1000 倍。但是由于扩散模型采样过程中的随机性,OA-ReactDiff 生成的过渡态也是随机的,往往需要多次采样才能获得理想的过渡态结构。
作为 OA-ReactDiff 的迭代升级版本,React-OT 在 OA-ReactDiff 的基础上,针对给定的反应物和生成物(双端搜索)进行了改进,基于最优传输理论,通过流匹配方法,从反应物和产物直接推导 TS 结构,单次采样即可生成确定性的 TS 结构。

💡最优传输(OT)
最优传输是一种数学理论和计算方法,用于描述两个概率分布之间的距离或者对应关系。它的核心概念是如何以最佳方式将一组资源(如质量、能量等)从一个位置传输到另一个位置。类比初中学习的线性规划问题:三个城市(A, B, C)分别有 1、0.5、1.5 吨煤,另外有两个城市(D, E)分别需要 2、1 吨煤,由于不同城市之间的运输成本不同,城市需求也不同,需要制定策略给出最优运输路线,这些「最优路线」在化学反应中就代表了最合理化学反应路径以其对应的过渡态结构。
🌟技术亮点速览
1.初始过渡态结构:OA-ReactDiff 从高斯噪音中随机采样,所以生成的过渡态也存在随机性。React-OT 则是从反应物和产物的线性插值出发,并且通过平移旋转等操作确保初始结构的等变性和唯一性,获得相对合理的初始猜测,将采样路径推向更接近最优传输的方向。
2.采样过程:OA-ReactDiff 采用扩散模型,过渡态生成是一个随机采样过程。而 React-OT 将采样过程模拟为常微分方程,而不是扩散模型中的随机微分方程,将反应物、产物和过渡态的联合分布视为动态传输问题,通过流匹配(flow matching)方法,直接从反应物和产物推导 TS 结构,不再需要多次随机采样。
3.更大数据集的预训练:使用 RGD1-xTB 数据集对 React-OT 进行预训练,然后再在 Transition 1x 数据集上进行模型的微调,RGD1-xTB 包含 95 万个基于 GFN2-xTB 计算的化学反应,对比训练 OA-ReactDiff 使用的Transition1x 数据集(1 万个反应),RGD1-xTB 的数据量大幅增加,可为 React-OT 提供更广泛的化学环境和结构信息。
图 2:扩散模型和最佳传输模型生成 TS 结构的工作概述(左)OA-ReactDiff 的随机推理过程。(右)React-OT 的确定性推理过程
二、结果一览
📈挤爆牙膏的性能提升
在使用 Transition 1x 训练 React-OT 之前,先在 RGD1-xTB 数据集上对 React-OT 进行了预训练,预训练后,React-OT 在 TS 预测精度上实现了显著提升:生成结构的 RMSD 中位数和势垒高度误差降低 25% 以上,相比未预训练模型精度提升显著。除了精度的提升之外,搜索过渡态所需运行时间也显著减少。OA-ReactDiff 在单张 GPU 上需 6 秒完成过渡态搜索,而 React-OT 的采样过程消除了随机性,只要 0.4 秒就可以得到正确的 TS 结构。对比 OA-ReactDiff,React-OT 能适应更复杂的化学反应类型,对未见过反应的预测能力也要更好。
图 3:React-OT 和 OA-ReactDiff 模型在生成过渡态的精度和速度方面的性能对比 a. React-OT 得到满足特定 RMSD 要求的 TS 结构的可能性高于两种扩散模型。b. OA-ReactDiff 和 React-OT 生成过渡态的质量。c. 两种模型预测效果的对比。d. 运行速度的比较。
🌐在反应网络中的应用
在经过 RGD1-xTB 预训练后,React-OT 显著提升了对未见反应类型的适应性和预测能力,即使在 12 个非氢原子的复杂反应体系中,仍能准确生成 TS 结构,具备应对多步有机反应的能力。为了探索 React-OT 在反应网络探索中的实际应用,这篇文章选择γ-酮过氧化氢(KHP)作为研究对象。KHP 是一个备受关注的反应体系,近年来被广泛用于基准测试。
图 4:KHP 的反应网络 其中红色/黑色的数字分别为 DFT 计算/React-OT 生成的过渡态上计算得到的活化能
可以看到,React-OT 生成的反应网络与文献记载的KHP反应节点完全一致,表明其能够准确捕捉所有关键反应,且两者的平均绝对能量差仅为 3.84 kcal/mol。这一案例研究展示了 React-OT 在加速反应网络探索中的应用潜力。
三、应用展望
段辰儒表示,「人类眨眼的平均时间是 0.4 秒。在这个时间内 React-OT 就可以精准的找到一个化学反应的过渡态,这在之前是不可想象的。极致的加速会产生行为模式的质变,React-OT 将改变我们对化学反应的理解和探索新材料的方式。」
💻应用场景前瞻
•催化剂设计:快速筛选高活性反应路径,加速清洁能源催化剂开发。
•药物合成:精准预测有机反应能垒,优化合成路线,降低实验成本。
•材料探索:构建超大型反应网络,发现新型功能材料(如 MOFs、钙钛矿)。
未来已来
React-OT标志着化学反应TS搜索进入高效、精准的新纪元,有望成为计算化学领域的重要工具。欢迎关注深度原理Deep Principle团队,探索更多前沿研究!
进一步了解 React-OT:
https://bohrium.dp.tech/notebooks/47742251216
模型试用: