第一作者:Shuhao Zhang通訊作者:Nicholas Lubbers, Richard A. Messerly, Justin S. Smith通訊單位:卡內(nèi)基梅隆大學(xué),洛斯·阿拉莫斯國家實驗室,南衛(wèi)理公會大學(xué),英偉達(dá)公司成果速覽 本研究開發(fā)了一種通用的反應(yīng)性機(jī)器學(xué)習(xí)勢能(ANI-1xnr),通過自動化采樣凝聚相反應(yīng),成功應(yīng)用于五個不同的系統(tǒng):碳固相成核、乙炔形成的石墨烯環(huán)、生物燃料添加劑、甲烷燃燒以及早期地球小分子自發(fā)形成甘氨酸。在所有研究中,ANI-1xnr與實驗數(shù)據(jù)(如果有的話)和/或使用傳統(tǒng)模型化學(xué)方法的先前研究緊密匹配。該研究證明了ANI-1xnr是C、H、N和O元素在凝聚相中的一種高度通用的反應(yīng)性MLIP,使得高通量in silico反應(yīng)化學(xué)實驗成為可能。圖文導(dǎo)讀圖1:納米反應(yīng)器主動學(xué)習(xí)工作流程和特定應(yīng)用概述。AL循環(huán)是一種自動化、迭代和高效的方法,用于開發(fā)MLIP。AL生成的訓(xùn)練數(shù)據(jù)集僅包含基于MLIP集合識別的高不確定性結(jié)構(gòu)的量子計算。通過NR模擬采樣與凝聚相反應(yīng)化學(xué)相關(guān)的結(jié)構(gòu)。初始系統(tǒng)由隨機(jī)配置的小分子構(gòu)建,這些小分子由C、H、N和O元素組成。通過使用當(dāng)前MLIP進(jìn)行動態(tài)模擬,并在極端波動的溫度和體積下誘導(dǎo)化學(xué)反應(yīng)。圖2:使用納米反應(yīng)器主動學(xué)習(xí)生成的數(shù)據(jù)集(ANI-1xnr)分析。圖中展示了與文獻(xiàn)中非反應(yīng)性、近平衡分子在真空中的AL數(shù)據(jù)集(ANI-1x; 紅色點(diǎn))相比,ANI-1xnr數(shù)據(jù)集(藍(lán)色點(diǎn))的二維可視化。圖中展示了H、C、N和O元素的局部原子環(huán)境。ANI-1xnr數(shù)據(jù)集不僅涵蓋了ANI-1x數(shù)據(jù)集中采樣的大部分區(qū)域,而且還在這些區(qū)域之間進(jìn)行了插值,甚至大幅擴(kuò)展了這些區(qū)域。圖3:ANI-1xnr在碳固相成核模擬中的結(jié)果。圖中展示了在3.52 g cc?1、2.25 g cc?1和0.50 g cc?1特定密度下的結(jié)果。模擬以隨機(jī)碳位置開始,最終結(jié)構(gòu)與各自密度下預(yù)期的碳相一致。圖4:氧氣對乙炔形成石墨烯環(huán)的影響模擬結(jié)果。圖中展示了在不同O2/C2H2比例下,三、四、五、六、七元環(huán)形成的數(shù)量與模擬時間的關(guān)系。增加氧氣比例會減少形成的環(huán)的數(shù)量,這與Lei等人的模擬結(jié)果和實驗文獻(xiàn)一致。圖5:生物燃料添加劑模擬結(jié)果。圖中展示了在不同生物燃料模擬中,O2和主要產(chǎn)物(CO、CO2和H2O)的追蹤圖。對于每種添加劑,與清潔生物燃料相比,IDT顯著降低。圖6:甲烷燃燒模擬結(jié)果。圖中展示了O2、CH4和主要產(chǎn)物(CO、CO2和H2O)的追蹤圖。追蹤圖和快照證實了ANI-1xnr對這種系統(tǒng)的化學(xué)反應(yīng)的合理預(yù)測。然而,ANI-1xnr的反應(yīng)性明顯高于文獻(xiàn)中的特定應(yīng)用MLIP。圖7:Miller實驗?zāi)M結(jié)果。圖中展示了從簡單小分子物種(例如NH3、CO、H2O、H2和CH4)開始形成甘氨酸的反應(yīng)途徑。綠色箭頭表示W(wǎng)ang等人或Saitta和Saija識別的反應(yīng)。橙色箭頭表示與Wang等人或Saitta和Saija的反應(yīng)類似。亮點(diǎn)介紹 1. 開發(fā)了一種適用于廣泛反應(yīng)化學(xué)的通用反應(yīng)性機(jī)器學(xué)習(xí)勢能(ANI-1xnr),無需重新擬合即可應(yīng)用于不同系統(tǒng)。2. ANI-1xnr在碳固相成核、石墨烯環(huán)形成、生物燃料添加劑、甲烷燃燒和早期地球條件下甘氨酸的自發(fā)形成等多個系統(tǒng)中均與實驗數(shù)據(jù)和傳統(tǒng)模型化學(xué)方法緊密匹配。3. 通過主動學(xué)習(xí)(AL)策略,自動化采樣原子位置,有效探索了化學(xué)和結(jié)構(gòu)變異,生成了包含超過1,000種獨(dú)特分子的數(shù)據(jù)集。4. 研究證明了自動化化學(xué)探索工作流程的能力,建立了一個快速、準(zhǔn)確且通用的潛力,能夠模擬包含C、H、N和O元素的廣泛實際反應(yīng)系統(tǒng)。計算模擬在本研究中,計算模擬是核心方法之一,涉及多種計算技術(shù),包括密度泛函理論(DFT)計算、分子動力學(xué)(MD)模擬以及機(jī)器學(xué)習(xí)(ML)模型的開發(fā)和應(yīng)用。DFT計算:研究中使用了基于DFT的方法來生成訓(xùn)練數(shù)據(jù)集,其中采用了Becke, Lee, Yang和Parr(BLYP)泛函、三重ζ價基組加上兩組極化函數(shù)(TZV2P)、Goedecker-Teter-Hutter(GTH)贗勢以及Grimme的第三代分散校正(D3)方法。DFT計算用于提供精確的能量和原子力數(shù)據(jù),作為機(jī)器學(xué)習(xí)模型訓(xùn)練的基準(zhǔn)。分子動力學(xué)模擬:研究中應(yīng)用了分子動力學(xué)模擬來模擬和研究不同條件下的化學(xué)反應(yīng)和物理過程。通過使用當(dāng)前的機(jī)器學(xué)習(xí)勢能模型,模擬了極端溫度和體積波動下的化學(xué)反應(yīng),以誘導(dǎo)化學(xué)鍵的形成和斷裂,從而探索新的化學(xué)結(jié)構(gòu)和反應(yīng)途徑。機(jī)器學(xué)習(xí)模型:研究開發(fā)了一種名為ANI-1xnr的通用反應(yīng)性機(jī)器學(xué)習(xí)勢能。該模型通過自動化采樣和迭代的主動學(xué)習(xí)過程進(jìn)行訓(xùn)練,能夠描述廣泛的化學(xué)系統(tǒng)而不需求額外的專門化。機(jī)器學(xué)習(xí)模型的訓(xùn)練包括能量和力項,使用早期停止和學(xué)習(xí)率退火策略以防止過擬合,并確保高保真度擬合。這些計算模擬方法的結(jié)合使得研究能夠在原子尺度上深入理解和預(yù)測化學(xué)反應(yīng)和物理過程,為材料設(shè)計和化學(xué)過程提供了強(qiáng)有力的計算工具。通過這些方法,研究成功地探索了從碳固相成核到甲烷燃燒等多個重要化學(xué)過程,并證明了機(jī)器學(xué)習(xí)勢能作為一種高效且通用的工具在凝聚相化學(xué)研究中的潛力。文獻(xiàn)信息標(biāo)題:Exploring the frontiers of condensed-phase chemistry with a general reactive machine learning potential期刊:Nature ChemistryDOI:10.1038/s41557-023-01427-3