末成年小嫩xb,嫰bbb槡bbbb槡bbbb,免费无人区码卡密,成全高清mv电影免费观看

基于量子輔助深度學習的逆向分子設計

基于量子輔助深度學習的逆向分子設計

康奈爾大學Fengqi You教授團隊,通過結合量子計算(QC)與生成式AI的優勢,提出了一個新穎的逆向分子設計框架。

該框架利用QC輔助的深度學習模型來學習和模擬化學空間,從而預測并生成具有特定化學性質的分子結構。生成式AI在此過程中起著核心作用,它能夠從大量的分子數據中學習潛在的結構-性質關系,并生成新的分子候選物,這些分子不僅符合預設的性質,還考慮到合成的可行性。

量子計算的加入則為這一過程提供了高效的計算能力和優化算法,克服了傳統計算機在處理大規模化學系統時的性能瓶頸。通過這種量子-經典混合計算框架,研究人員能夠在復雜的化學空間中進行高效、有效的分子設計,為新分子的發現和材料科學的進步開辟了新途徑。

相關研究以《Molecular design with automated quantum computing-based deep learning and optimization》為題,發表在《npj Computational Materials》上。

基于量子輔助深度學習的逆向分子設計

論文鏈接:https://www.nature.com/articles/s41524-023-01099-0

研究背景

分子設計 Vs?逆向分子設計

分子設計(Molecular Design)通常是基于現有知識和原理來創建新分子的過程,科學家們依據對化學結構和性質的理解來設計和合成新分子。這一過程涉及到從理論出發,預測新分子的性質,并通過實驗驗證。這種方法在藥物開發和新材料創造中扮演著重要角色,它側重于利用已知的化學信息來推動新分子的發現。

逆向分子設計(Inverse Molecular Design)則是從所需的性質出發,通過計算方法和人工智能技術在化學空間中搜索或構建能表現這些性質的分子結構。這種數據驅動的方法使得藥物發現和功能材料開發更為高效,尤其在需要探索未知化學空間以發現具有特定功能的新分子時更顯其優勢。逆向設計強調從目標性質出發,逆向推導出可能的分子結構。

相較于傳統分子設計,逆向分子設計的優勢在于其高度的數據驅動性和計算密集性,允許科學家們在龐大的化學空間中有效地篩選出理想的分子,這在傳統方法中是不可想象的。它通過人工智能算法加速了藥物篩選和新材料的發現過程,特別是在對未知領域進行探索時,能夠發現傳統方法可能忽視的結構。這種方法在藥物發現和功能材料開發中尤為有用,能夠顯著提高發現的速度和創新性。

生成式人工智能

隨著機器學習以及深度學習技術的發展,生成式人工智能(Generative AI)在逆向分子設計中的應用,展現了其強大的數據處理和學習能力。通過深度學習模型,如生成對抗網絡(GANs)和變分自編碼器(VAEs),這些AI系統能夠理解和模擬分子數據集的復雜分布,生成符合特定性質要求的新分子。

這些模型分別依靠對抗過程和概率編碼來生成數據,其中GANs由競爭的生成器和鑒別器組成,VAEs則通過優化潛在空間的表示來重構數據。這一技術大幅提升了在藥物設計和新材料發現領域的效率。

盡管如此,生成式AI在實現穩定性和合成可行性方面還存在挑戰,并且當數據集質量和量級不足以支持復雜分子結構的學習時,其性能可能受限。因此,盡管生成式AI為逆向分子設計提供了前所未有的工具,但仍需要在算法優化、數據質量提升以及跨學科合作方面進行持續的研究和發展。

研究的主要貢獻

1. 提出了一種數據高效的量子-經典混合方法,用于分子性質估計,該方法利用了QC輔助學習訓練的深度學習模型來提取分子的穩健潛在表示。

2. 開發了一種基于QC的近似優化技術,利用訓練好的性質估計模型以指導的方式探索化學空間并識別具有所需性質的候選分子。

3. 與現有基于深度學習的分子設計方法相比,所提出的基于量子計算輔助的分子設計框架高效地生成了多個具有不同生理化學性質目標的類藥物分子。

模型結構

基于量子輔助深度學習的逆向分子設計

圖1:分子生成的QC輔助學習和優化策略概述。

圖1概述了本研究中用于分子生成的QC輔助的學習和優化策略。該圖展示了基于能量的模型,該模型通過從量子退火器(quantum annealer)抽取樣本進行訓練,并捕捉分子結構與分子性質之間的關系,然后模型根據習得的關系,通過圖卷積神經網絡生成具有目標性質的新的分子結構。

此外,另外一個條件能量基模型被用于估計輸入分子的自由能并計算目標值。通過量子退火器以迭代方式解決二次無約束二進制優化(QUBO)問題,產生具有所需目標性質的候選分子。

具體實驗結果細節如下:

圖2中展示了采用不同方法獲得的各種輸入數據在前饋模型預測性能方面的誤差比較結果。

本文通過訓練多個條件能量模型,并結合對比發散(CD)學習與QC輔助學習策略,獲取了一系列這些潛在表征。利用相應能量模型的每個潛在表征,通過前饋網絡進行重復實驗,以測量相關指標及其統計特性。

在采用基于規則的分子描述符作為輸入的基準預測模型中,較大的ECFP指紋普遍更適合于預測QED和LogP,而含有MACCS的預測模型在預測可及性分數方面表現更佳。

基線模型采用圖卷積神經網絡模型生成的指紋,在預測分子的藥物樣性時顯示出顯著更高的誤差,但在其它分子性質方面的預測結果相較于合成可及性評分的最低誤差僅增加了13.6%。與此相對,使用經典和QC輔助學習技術訓練得到的條件能量模型的潛在變量表示,雖然其維度較低,卻在所有屬性目標的預測性能上表現出色。

采用QC輔助生成訓練得到的潛在表示的預測模型,不僅在預測誤差上與其他基線模型相當,而且在預測分子的藥物樣性時表現出最小的誤差。這些計算結果充分證明了通過QC輔助學習訓練的條件能量模型所得潛在表示在分子性質預測方面的有效性。

基于量子輔助深度學習的逆向分子設計

圖 2 :采用不同方法獲得的各種輸入數據在前饋模型預測性能方面的誤差比較結果。

研究者們運用了經過訓練的能量基模型,并結合新提出的量子計算(QC)輔助優化技術,對分子的藥物樣性和分配系數等性質施加了目標條件,實現了有目的的分子生成。

圖3展示了這些技術生成分子的統計數據及其計算性質,并與訓練集中滿足同樣條件的分子進行了比較。這一對比揭示了針對特定屬性目標,基于QC方法生成的分子確實滿足了既定的條件。

然而,某些目標屬性下,深度學習方法如CVAE和MGM顯示出生成符合要求的分子的能力,而遺傳算法GBGA則在這一任務上效率較低,可能需要對每個目標屬性進行適應性函數的手動調節。

基于量子輔助深度學習的逆向分子設計

圖3:這些技術生成分子的統計數據及其計算性質,并與訓練集中滿足同樣條件的分子進行了比較。

基于量子輔助深度學習的逆向分子設計

圖 4:生成分子與訓練集中分子的定量比較。

此外,圖4中的c和d小圖詳細描繪了所有生成分子的合成可及性分數(SAS)分布,反映了它們在合成上的難易程度。這些小提琴圖表明,QED和LogP值較低的分子在SAS分數上的變異性更大,盡管它們的平均SAS分數相對較高。相反地,藥物樣性更好和LogP值較高的分子顯示出了不同的分布趨勢。

研究者還利用t-SNE技術分析了條件能量模型生成的分子的潛在表示,這些通過2D嵌入可視化的表示幫助識別分子與其性質之間的關聯度。

圖5展現了基于QED值進行著色的訓練集分子和生成分子的2D t-SNE嵌入,以及不同屬性目標的分子結構示例,顯示出不同屬性范圍內潛在表示的區分,這表明所構建的模型能有效地捕捉分子屬性之間的復雜關系。

基于量子輔助深度學習的逆向分子設計

圖 5:使用t-SNE方法得到的訓練集中分子的二維嵌入。

本研究還采用t-SNE嵌入方法來分析使用訓練過的條件能量模型生成的分子的潛在表示。通過將這些潛在表示映射到二維空間,有助于揭示分子與其相應性質之間的關聯程度。

圖5展示了使用t-SNE方法得到的訓練集中分子的二維嵌入,以及根據QED屬性值進行著色的生成分子。作者在此圖中還包括了不同屬性目標的分子結構示例。不同屬性范圍的潛在表示之間的區分表明,具有相似QED值的分子在空間上相互鄰近,這表明構建的基于能量的模型成功捕捉了分子與其屬性之間的關系,因為具有相似性質的分子在嵌入空間中聚集。

原創文章,作者:計算搬磚工程師,如若轉載,請注明來源華算科技,注明出處:http://www.zzhhcy.com/index.php/2024/01/30/5ce46f983e/

(0)

相關推薦

主站蜘蛛池模板: 农安县| 江西省| 海林市| 平塘县| 奉节县| 广河县| 右玉县| 乌审旗| 九江县| 来安县| 吉首市| 正安县| 平阳县| 上饶县| 阜新市| 阳城县| 云林县| 玉溪市| 谷城县| 揭西县| 沙洋县| 汾阳市| 千阳县| 岑巩县| 洪湖市| 成安县| 化隆| 永登县| 大方县| 临清市| 兴隆县| 临夏县| 沅江市| 卓资县| 姚安县| 内乡县| 和平区| 临湘市| 大厂| 鹰潭市| 治多县|