
目前,使用機器學習(ML)預測化學反應結果已成為推進材料合成的有力工具。然而,這種方法需要大量多樣的數據集,由于文獻報道不一致、非標準化及對合成機制缺乏了解,這些數據集在納米材料合成領域的應用極為有限。
在此,美國華盛頓大學Brandi M. Cossairt等人采用不同的預測性ML算法來深入了解反應條件控制對InP量子點(QD)的粒徑、吸收和發射波長的報告數據。具體而言,作者從72篇出版物中提取了InP QD合成的參數作為輸入,并將所得特性作為輸出。使用數據插補方法“填充”缺失的輸出,作者準備了包含216個條目的完整數據集用于訓練和測試預測性ML模型。根據化學特性或試劑的作用,作者以兩種方式(壓縮和擴展)定義描述符空間以研究在可用數據有限的情況下預測QD合成結果的最佳方法。
作者測試了單輸出和多輸出ML算法,發現盡管輸出目標(直徑、吸收和發射波長)之間存在物理關系,但單輸出模型的性能優于多輸出模型。模型的性能通過不同的方式進行驗證,包括分層k折驗證、與非估算數據集的比較及與新收集的實驗數據的比較。
圖1. 工作流程及輸出/輸入特征選擇
基于最好的 ML 模型,作者實現了吸收、發射和直徑分別低至20.29、11.46 和0.33 nm的平均絕對誤差。從模型估計誤差中,作者發現反應溫度、時間和鋅鹽的添加量是影響最大的合成參數。此外,作者部署了一個開源網絡應用程序https://share.streamlit.io/cossairt-lab/indium-phosphide/Hot_injection/hot_injection_prediction.py,以便外部用戶可使用其來預測InP合成結果。
基于該程序,作者研究了InP合成中的化學趨勢,如鋅鹽和三辛基膦等常見添加劑的影響等。作者還基于文獻程序的擴展設計并進行了新的實驗,并將實驗測量特性與預測進行了比較,從而評估了模型的準確性。最后,通過擴展先前發布的數據集,作者應用相同的方法來訓練、測試和啟動CdSe QD的預測模型。總而言之,這項研究提出的數據預處理和ML方法證明了即使面對有限的數據資源,也能夠設計具有目標特性的材料并探索潛在的反應機制。
圖2. 實驗值與ML模型預測值的奇偶校驗圖
Predicting Indium Phosphide Quantum Dot Properties from Synthetic Procedures Using Machine Learning, Chemistry of Materials 2022. DOI: 10.1021/acs.chemmater.2c00640
原創文章,作者:v-suan,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2023/10/07/ae2d6072b3/