末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置

?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
二維(2D)共價有機框架(COF)的帶邊位置(band-edge)對其在光催化劑和納米電子學中的應用起著至關重要的作用。然而,由于COF結構的多樣性和復雜性,通過第一性原理計算,在大量的二維COFs中獲得具有目標帶邊位置的非常耗時。
為此,中國科學技術大學武曉君等人提出了一種通過結合第一性原理計算和機器學習(ML)來預測二維COFs帶邊位置的策略。在測試數據集上,預測的價帶頂(VBM)和導帶底(CBM)與第一性原理計算值的均方根誤差分別為0.229和0.247 eV,同時也在高階的雜化泛函上建立了線性關系,為高效預測2D COFs的帶邊位置提供了有效的工具。
圖文導讀
ML技術具備快速預測的能力,近年來在材料發現中得到了廣泛應用。已經開發了幾種ML模型來預測COFs的氣體吸附和分離、電催化性能、和吸附熱泵。在本研究中,作者采用第一性原理計算和機器學習方法,建立了分子前體軌道能量與二維COFs帶邊位置(VBMs和CBMs)之間關系的圖神經網絡(GNN)模型。
作者從CoRE COF Database數據庫中收集到了591個實驗合成的COF結構(從2005年到2021年),在剔除了3D的COF、重復數據、帶有金屬離子等結構后,剩下381個2D COF結構(圖1a)。
之后,作者利用第一性原理,在PBE水平下計算了這381個COF結構的帶邊位置,如圖1b-c所示。數據集分為訓練數據集(80%)和測試數據集(20%)。考慮到HSE06計算的時間成本,30個原子數小于100的2D COFs的VBM和CBM位置使用了HSE06計算(圖1d)。
對于使用HSE06計算的VBM和CBM位置的小數據集,構建一個大的測試數據集(50%),以確保預測模型的泛化能力。所有ML方法都是在訓練數據集中進行訓練的,測試數據集用于驗證ML方法的泛化能力,并選擇性能最好的預測模型。
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
圖1.(a)數據集構建(b)計算的VBM分布直方圖(c)計算的CBM分布直方圖(d)使用HSE06計算的CBM和VBM
訓練ML模型需要設計好的材料描述符。由于二維COFs是用分子前體實驗合成的,因此,作者將分子性質作為描述符來預測二維COFs的電子結構。分子軌道可以近似地表示為原子軌道的線性組合,因此可以用分子軌道能量作為描述符來預測用PBE計算出的VBM和CBM的位置。
描述符包括前線分子軌道及其鄰近軌道的能量,最高已占據分子軌道(HOMO),最低的未占據分子軌道(LUMO)以及HOMO和LUMO鄰近的軌道。作者用B3LYP泛函計算了這些分子軌道的能量。
考慮到二維COFs中相鄰分子構建塊之間的相互作用影響其電子帶結構,將二維COFs的拓撲結構包含在描述符中。由于分子構建塊之間的相互作用,使用無向圖來表示二維COF,構建具有類似于2D COF拓撲結構的晶體圖,其中每個分子構建塊和每個連接由一個節點和一條邊表示。
為了明確描述符的構建過程,以TFB(1,3,5-三甲基苯)和聯苯胺分子組裝的BND-TFB COF為例,如圖2a所示。在無向圖中,每個TFB分子與三個聯苯胺分子相連。EHOMO-4,…,EHOMO-1,EHOMO,ELUMO,ELUMO+1…,用兩種分子的ELUMO+4作為描述符來描述分子前體,如圖2b所示。
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
圖2. (a)圖中節點表示分子前體,黃色節點代表TFB分子,藍色節點代表聯苯胺分子(b)分子軌道描述符
作者通過使用圖卷積網絡(GCNs)和圖注意網絡(GATs)兩個ML過程,在PBE水平上預測VBM和CBM的位置。為了得到合適的超參數,使用了交叉驗證和網格搜索。選擇5個指標來評價每個ML模型的性能,包括平均絕對誤差(MAE)、均方根誤差(RMSE)、皮爾遜相關系數(R)、平均絕對分數誤差(MAEF)和均方根分數誤差(RMSEF)。
選擇分子描述符后,將在測試數據集中預測的VBM和CBM位置與在PBE水平的計算結果進行比較,如圖3所示。圖3a-b中的散點圖顯示了GCN和GAT模型預測的VBM分布,其中大部分預測結果分布在基線附近。在98.7%的情況下,兩種模型在PBE水平上的VBM位置的相對誤差在10%以內。
圖3c-d顯示了兩種模型預測的CBM分布。GCN和GAT模型在PBE水平上的相對誤差分別為85.7%和83.1%。相對誤差表明,GCN和GAT模型在PBE水平上對VBM位置的預測優于CBM位置,而CBM位置的預測,GCN模型優于GAT模型。
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
圖3. GCN(a)和GAT(b)預測的VBM的散點圖和誤差,GCN(c)和GAT(d)預測的CBM的散點圖和誤差(PBE水平)
表1總結了GCN和GAT模型在PBE水平預測VBM和CBM的MAE、RMSE、MAEF、RMSEFR值。在測試數據集中,GCN和GAT模型在PBE水平上對VBM預測的RMSE值相似,分別為0.227和0.229 eV。對應的MAE值也相似,分別為0.175 eV和0.174 eV。GAT模型的分數誤差值(RMSEF和MAEF)小于GCN模型。對于PBE水平的CBM預測,GCN模型的RMSE (0.247 eV)和MAE(0.174 eV)均小于GAT模型。
GAT模型的分數誤差大于GCN模型,可能是由于離群數據的相對誤差大于20%。在半導體中,CBM的絕對值通常小于VBM的絕對值。即使CBM和VBM的預測也具有相似的誤差值,并且由于前者的分母較小,CBM預測的分數誤差大于VBM預測的分數誤差。
表1列出了R的計算值,其范圍為82%~87%,表明VBM和CBM的預測與PBE計算結果高度相關,GAT模型適用于VBM的預測,GCN模型適用于CBM的預測。
表1. 預測VBM和CBM的性能統計(PBE水平)
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
不過,PBE泛函總是低估半導體的帶隙,而HSE06泛函在第一性原理計算中被廣泛用于獲得精確的電子結構。然而,HSE06計算的時間成本巨大,阻礙了在HSE06水平上對2D COF的大規模篩選。
為此,作者創建了線性模型(線性回歸和嶺回歸)來探索用HSE06和PBE泛函計算的帶邊位置之間的相關性。作者以包含少于100個原子的30個2D COFs作為數據集,并使用PBE泛函計算的帶邊位置作為描述符來預測使用HSE06泛函計算的帶邊位置。圖4顯示了ML預測結果與使用HSE06計算結果的比較。
可以發現,VBM和CBM位置的相對預測誤差均小于5%,且兩種方法的PBE泛函計算結果與HSE06泛函計算結果均表現出較強的直接線性相關性。表2列出了計算的MAE、RMSE、MAEF、RMSEFR值。這兩種方法的RMSE值都可以忽略不計,在HSE06水平上,VBM和CBM的RMSE值分別為0.089~0.090 eV和0.042~0.043 eV。RMSEF值也較小,分別為1.524%~1.532%和1.455%~1.489%。
作者進一步建立了PBE和HSE06泛函的帶邊位置之間的線性關系,定義為CBMHSE(或VBMHSE)= a×VBMPBE+b×CBMPBE+c。對于預測HSE06水平的VBM, ab值分別為1.208和0.036。對于嶺回歸預測HSE06水平的CBM,這兩個值分別為- 0.079和1.117。
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
圖4. GCN(a)和GAT(b)預測的VBM的散點圖和誤差,GCN(c)和GAT(d)預測的CBM的散點圖和誤差(HSE06水平)
表2. 預測VBM和CBM的性能統計(HSE06水平)
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
然后,作者開發了一個工作流程來預測二維COFs的VBM和CBM,無需電子帶結構計算,如圖5所示。在HSE06精度下,預測VBM和CBM的MAE值分別小于0.293和0.242 eV,該工作流程可用于加速篩選具有合適帶邊位置的2D COFs。
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置
圖5. 預測二維COFs的VBM和CBM工作流程
在中性條件下,當CBM和VBM的位置位于H+/H2(-4.02 V)和O2/H2O(- 5.25 V)的氧化還原電位之間時,可以作為水分解的光催化劑。
如圖6所示,作者篩選出182個2D COFs適合作為水分解的光催化劑;107種2D COFs作為析氫反應光催化劑,11種2D COFs作為析氧反應光催化劑。此外,59個2D COFs具有大于3.10 eV的寬帶隙,可用于室溫探測器。
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置

圖6. 在HSE06水平下的2D COFs的VBM和CBM位置分布,這些COFs適用于(a)水分解,(b)僅析氫反應和(c)僅析氧反應

總結展望
作者報告了一種結合第一性原理計算和基于GNN的機器學習的方法,使用分子前驅體的前線分子軌道及其相鄰分子軌道預測2D COF半導體帶邊位置。基于所建立的ML模型,作者以HSE06的精度預測了用于光催化水分解和納米電子學的2D COF的帶邊位置。此外,相信隨著未來COF數據集的擴展,ML模型可以進一步完善。
文獻信息
Dayong Wang, Haifeng Lv, Yangyang Wan, Xiaojun Wu, Jinlong Yang. Band-Edge Prediction of 2D Covalent Organic Framework from molecular Precursor via Machine Learning. Journal of Physical Chemistry Letters 14, 6757-6764 (2023)
https://doi.org/10.1021/acs.jpclett.3c01419
?【AI+DFT+材料】JPCL:機器學習預測二維COF材料的帶邊位置

 點擊閱讀原文,報名計算培訓!


原創文章,作者:計算搬磚工程師,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/24/1061e5205c/

(0)

相關推薦

主站蜘蛛池模板: 沈阳市| 贵南县| 锦州市| 兴城市| 莱西市| 祁阳县| 酉阳| 麻阳| 高邑县| 新密市| 宝山区| 昌乐县| 毕节市| 大同县| 南阳市| 镇原县| 萍乡市| 德兴市| 梨树县| 清丰县| 襄汾县| 临泽县| 贵州省| 铜山县| 抚松县| 建阳市| 怀宁县| 阿巴嘎旗| 昂仁县| 忻城县| 芷江| 三原县| 沽源县| 柘城县| 贵德县| 庆城县| 漠河县| 朝阳区| 克什克腾旗| 辛集市| 乐亭县|