国产三级精品三级在线观看,国产高清无码在线观看,中文字幕日本人妻久久久免费,亚洲精品午夜无码电影网

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

康奈爾大學(xué)Fengqi You教授團(tuán)隊(duì),通過結(jié)合量子計(jì)算(QC)與生成式AI的優(yōu)勢,提出了一個(gè)新穎的逆向分子設(shè)計(jì)框架。

該框架利用QC輔助的深度學(xué)習(xí)模型來學(xué)習(xí)和模擬化學(xué)空間,從而預(yù)測并生成具有特定化學(xué)性質(zhì)的分子結(jié)構(gòu)。生成式AI在此過程中起著核心作用,它能夠從大量的分子數(shù)據(jù)中學(xué)習(xí)潛在的結(jié)構(gòu)-性質(zhì)關(guān)系,并生成新的分子候選物,這些分子不僅符合預(yù)設(shè)的性質(zhì),還考慮到合成的可行性。

量子計(jì)算的加入則為這一過程提供了高效的計(jì)算能力和優(yōu)化算法,克服了傳統(tǒng)計(jì)算機(jī)在處理大規(guī)?;瘜W(xué)系統(tǒng)時(shí)的性能瓶頸。通過這種量子-經(jīng)典混合計(jì)算框架,研究人員能夠在復(fù)雜的化學(xué)空間中進(jìn)行高效、有效的分子設(shè)計(jì),為新分子的發(fā)現(xiàn)和材料科學(xué)的進(jìn)步開辟了新途徑。

相關(guān)研究以《Molecular design with automated quantum computing-based deep learning and optimization》為題,發(fā)表在《npj Computational Materials》上。

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

論文鏈接:https://www.nature.com/articles/s41524-023-01099-0

研究背景

分子設(shè)計(jì) Vs?逆向分子設(shè)計(jì)

分子設(shè)計(jì)(Molecular Design)通常是基于現(xiàn)有知識和原理來創(chuàng)建新分子的過程,科學(xué)家們依據(jù)對化學(xué)結(jié)構(gòu)和性質(zhì)的理解來設(shè)計(jì)和合成新分子。這一過程涉及到從理論出發(fā),預(yù)測新分子的性質(zhì),并通過實(shí)驗(yàn)驗(yàn)證。這種方法在藥物開發(fā)和新材料創(chuàng)造中扮演著重要角色,它側(cè)重于利用已知的化學(xué)信息來推動(dòng)新分子的發(fā)現(xiàn)。

逆向分子設(shè)計(jì)(Inverse Molecular Design)則是從所需的性質(zhì)出發(fā),通過計(jì)算方法和人工智能技術(shù)在化學(xué)空間中搜索或構(gòu)建能表現(xiàn)這些性質(zhì)的分子結(jié)構(gòu)。這種數(shù)據(jù)驅(qū)動(dòng)的方法使得藥物發(fā)現(xiàn)和功能材料開發(fā)更為高效,尤其在需要探索未知化學(xué)空間以發(fā)現(xiàn)具有特定功能的新分子時(shí)更顯其優(yōu)勢。逆向設(shè)計(jì)強(qiáng)調(diào)從目標(biāo)性質(zhì)出發(fā),逆向推導(dǎo)出可能的分子結(jié)構(gòu)。

相較于傳統(tǒng)分子設(shè)計(jì),逆向分子設(shè)計(jì)的優(yōu)勢在于其高度的數(shù)據(jù)驅(qū)動(dòng)性和計(jì)算密集性,允許科學(xué)家們在龐大的化學(xué)空間中有效地篩選出理想的分子,這在傳統(tǒng)方法中是不可想象的。它通過人工智能算法加速了藥物篩選和新材料的發(fā)現(xiàn)過程,特別是在對未知領(lǐng)域進(jìn)行探索時(shí),能夠發(fā)現(xiàn)傳統(tǒng)方法可能忽視的結(jié)構(gòu)。這種方法在藥物發(fā)現(xiàn)和功能材料開發(fā)中尤為有用,能夠顯著提高發(fā)現(xiàn)的速度和創(chuàng)新性。

生成式人工智能

隨著機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)技術(shù)的發(fā)展,生成式人工智能(Generative AI)在逆向分子設(shè)計(jì)中的應(yīng)用,展現(xiàn)了其強(qiáng)大的數(shù)據(jù)處理和學(xué)習(xí)能力。通過深度學(xué)習(xí)模型,如生成對抗網(wǎng)絡(luò)(GANs)和變分自編碼器(VAEs),這些AI系統(tǒng)能夠理解和模擬分子數(shù)據(jù)集的復(fù)雜分布,生成符合特定性質(zhì)要求的新分子。

這些模型分別依靠對抗過程和概率編碼來生成數(shù)據(jù),其中GANs由競爭的生成器和鑒別器組成,VAEs則通過優(yōu)化潛在空間的表示來重構(gòu)數(shù)據(jù)。這一技術(shù)大幅提升了在藥物設(shè)計(jì)和新材料發(fā)現(xiàn)領(lǐng)域的效率。

盡管如此,生成式AI在實(shí)現(xiàn)穩(wěn)定性和合成可行性方面還存在挑戰(zhàn),并且當(dāng)數(shù)據(jù)集質(zhì)量和量級不足以支持復(fù)雜分子結(jié)構(gòu)的學(xué)習(xí)時(shí),其性能可能受限。因此,盡管生成式AI為逆向分子設(shè)計(jì)提供了前所未有的工具,但仍需要在算法優(yōu)化、數(shù)據(jù)質(zhì)量提升以及跨學(xué)科合作方面進(jìn)行持續(xù)的研究和發(fā)展。

研究的主要貢獻(xiàn)

1. 提出了一種數(shù)據(jù)高效的量子-經(jīng)典混合方法,用于分子性質(zhì)估計(jì),該方法利用了QC輔助學(xué)習(xí)訓(xùn)練的深度學(xué)習(xí)模型來提取分子的穩(wěn)健潛在表示。

2. 開發(fā)了一種基于QC的近似優(yōu)化技術(shù),利用訓(xùn)練好的性質(zhì)估計(jì)模型以指導(dǎo)的方式探索化學(xué)空間并識別具有所需性質(zhì)的候選分子。

3. 與現(xiàn)有基于深度學(xué)習(xí)的分子設(shè)計(jì)方法相比,所提出的基于量子計(jì)算輔助的分子設(shè)計(jì)框架高效地生成了多個(gè)具有不同生理化學(xué)性質(zhì)目標(biāo)的類藥物分子。

模型結(jié)構(gòu)

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

圖1:分子生成的QC輔助學(xué)習(xí)和優(yōu)化策略概述。

圖1概述了本研究中用于分子生成的QC輔助的學(xué)習(xí)和優(yōu)化策略。該圖展示了基于能量的模型,該模型通過從量子退火器(quantum annealer)抽取樣本進(jìn)行訓(xùn)練,并捕捉分子結(jié)構(gòu)與分子性質(zhì)之間的關(guān)系,然后模型根據(jù)習(xí)得的關(guān)系,通過圖卷積神經(jīng)網(wǎng)絡(luò)生成具有目標(biāo)性質(zhì)的新的分子結(jié)構(gòu)。

此外,另外一個(gè)條件能量基模型被用于估計(jì)輸入分子的自由能并計(jì)算目標(biāo)值。通過量子退火器以迭代方式解決二次無約束二進(jìn)制優(yōu)化(QUBO)問題,產(chǎn)生具有所需目標(biāo)性質(zhì)的候選分子。

具體實(shí)驗(yàn)結(jié)果細(xì)節(jié)如下:

圖2中展示了采用不同方法獲得的各種輸入數(shù)據(jù)在前饋模型預(yù)測性能方面的誤差比較結(jié)果。

本文通過訓(xùn)練多個(gè)條件能量模型,并結(jié)合對比發(fā)散(CD)學(xué)習(xí)與QC輔助學(xué)習(xí)策略,獲取了一系列這些潛在表征。利用相應(yīng)能量模型的每個(gè)潛在表征,通過前饋網(wǎng)絡(luò)進(jìn)行重復(fù)實(shí)驗(yàn),以測量相關(guān)指標(biāo)及其統(tǒng)計(jì)特性。

在采用基于規(guī)則的分子描述符作為輸入的基準(zhǔn)預(yù)測模型中,較大的ECFP指紋普遍更適合于預(yù)測QED和LogP,而含有MACCS的預(yù)測模型在預(yù)測可及性分?jǐn)?shù)方面表現(xiàn)更佳。

基線模型采用圖卷積神經(jīng)網(wǎng)絡(luò)模型生成的指紋,在預(yù)測分子的藥物樣性時(shí)顯示出顯著更高的誤差,但在其它分子性質(zhì)方面的預(yù)測結(jié)果相較于合成可及性評分的最低誤差僅增加了13.6%。與此相對,使用經(jīng)典和QC輔助學(xué)習(xí)技術(shù)訓(xùn)練得到的條件能量模型的潛在變量表示,雖然其維度較低,卻在所有屬性目標(biāo)的預(yù)測性能上表現(xiàn)出色。

采用QC輔助生成訓(xùn)練得到的潛在表示的預(yù)測模型,不僅在預(yù)測誤差上與其他基線模型相當(dāng),而且在預(yù)測分子的藥物樣性時(shí)表現(xiàn)出最小的誤差。這些計(jì)算結(jié)果充分證明了通過QC輔助學(xué)習(xí)訓(xùn)練的條件能量模型所得潛在表示在分子性質(zhì)預(yù)測方面的有效性。

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

圖 2 :采用不同方法獲得的各種輸入數(shù)據(jù)在前饋模型預(yù)測性能方面的誤差比較結(jié)果。

研究者們運(yùn)用了經(jīng)過訓(xùn)練的能量基模型,并結(jié)合新提出的量子計(jì)算(QC)輔助優(yōu)化技術(shù),對分子的藥物樣性和分配系數(shù)等性質(zhì)施加了目標(biāo)條件,實(shí)現(xiàn)了有目的的分子生成。

圖3展示了這些技術(shù)生成分子的統(tǒng)計(jì)數(shù)據(jù)及其計(jì)算性質(zhì),并與訓(xùn)練集中滿足同樣條件的分子進(jìn)行了比較。這一對比揭示了針對特定屬性目標(biāo),基于QC方法生成的分子確實(shí)滿足了既定的條件。

然而,某些目標(biāo)屬性下,深度學(xué)習(xí)方法如CVAE和MGM顯示出生成符合要求的分子的能力,而遺傳算法GBGA則在這一任務(wù)上效率較低,可能需要對每個(gè)目標(biāo)屬性進(jìn)行適應(yīng)性函數(shù)的手動(dòng)調(diào)節(jié)。

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

圖3:這些技術(shù)生成分子的統(tǒng)計(jì)數(shù)據(jù)及其計(jì)算性質(zhì),并與訓(xùn)練集中滿足同樣條件的分子進(jìn)行了比較。

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

圖 4:生成分子與訓(xùn)練集中分子的定量比較。

此外,圖4中的c和d小圖詳細(xì)描繪了所有生成分子的合成可及性分?jǐn)?shù)(SAS)分布,反映了它們在合成上的難易程度。這些小提琴圖表明,QED和LogP值較低的分子在SAS分?jǐn)?shù)上的變異性更大,盡管它們的平均SAS分?jǐn)?shù)相對較高。相反地,藥物樣性更好和LogP值較高的分子顯示出了不同的分布趨勢。

研究者還利用t-SNE技術(shù)分析了條件能量模型生成的分子的潛在表示,這些通過2D嵌入可視化的表示幫助識別分子與其性質(zhì)之間的關(guān)聯(lián)度。

圖5展現(xiàn)了基于QED值進(jìn)行著色的訓(xùn)練集分子和生成分子的2D t-SNE嵌入,以及不同屬性目標(biāo)的分子結(jié)構(gòu)示例,顯示出不同屬性范圍內(nèi)潛在表示的區(qū)分,這表明所構(gòu)建的模型能有效地捕捉分子屬性之間的復(fù)雜關(guān)系。

基于量子輔助深度學(xué)習(xí)的逆向分子設(shè)計(jì)

圖 5:使用t-SNE方法得到的訓(xùn)練集中分子的二維嵌入。

本研究還采用t-SNE嵌入方法來分析使用訓(xùn)練過的條件能量模型生成的分子的潛在表示。通過將這些潛在表示映射到二維空間,有助于揭示分子與其相應(yīng)性質(zhì)之間的關(guān)聯(lián)程度。

圖5展示了使用t-SNE方法得到的訓(xùn)練集中分子的二維嵌入,以及根據(jù)QED屬性值進(jìn)行著色的生成分子。作者在此圖中還包括了不同屬性目標(biāo)的分子結(jié)構(gòu)示例。不同屬性范圍的潛在表示之間的區(qū)分表明,具有相似QED值的分子在空間上相互鄰近,這表明構(gòu)建的基于能量的模型成功捕捉了分子與其屬性之間的關(guān)系,因?yàn)榫哂邢嗨菩再|(zhì)的分子在嵌入空間中聚集。

原創(chuàng)文章,作者:計(jì)算搬磚工程師,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://m.xiubac.cn/index.php/2024/01/30/5ce46f983e/

(0)

相關(guān)推薦

平遥县| 共和县| 嵊州市| 建水县| 积石山| 南投县| 镇坪县| 平顺县| 彭水| 竹北市| 茂名市| 金山区| 沙田区| 辽源市| 大港区| 岳阳县| 建水县| 唐海县| 石家庄市| 蕲春县| 南澳县| 镇安县| 土默特左旗| 时尚| 股票| 遵化市| 格尔木市| 穆棱市| 彩票| 安龙县| 江北区| 屏南县| 天津市| 奉新县| 江达县| 沁水县| 彭泽县| 大荔县| 威信县| 曲周县| 阿鲁科尔沁旗|