酶催化合成反应对于广泛的应用至关重要。准确而快速地选择最佳合成条件对于人类知识和计算机预测来说至关重要且具有挑战性。在这项工作中,开发了一种将数据驱动的机器学习(ML)模型与反应性描述符相结合的新场景来预测最佳酶催化合成条件和反应产率。总共构建了 14 个反应性描述符来描述不同反应机制中包含的 125 个反应(分为 5 类)。开发了 19 个 ML 模型来训练数据集,并且发现二次支持向量机 (SVM) 模型表现出最佳性能。然后使用二次SVM模型来预测最佳反应条件,随后使用该最佳反应条件在每个反应的109 200个具有不同摩尔比的底物、溶剂、
水含量、酶浓度和温度的反应条件中获得最高产率。所提出的方案应普遍适用于各种
化学反应,并为优化有机合成反应的反应条件提供黑盒评估。