TSDiff 預(yù)測分布的概念說明。(來源:論文)
編輯?|?X
過渡態(tài)(TS)探索對于闡明化學(xué)反應(yīng)機(jī)制和動力學(xué)建模至關(guān)重要。最近,機(jī)器學(xué)習(xí)模型在 TS 幾何形狀(geometries)預(yù)測方面表現(xiàn)出了卓越的性能。然而,它們通常需要反應(yīng)物和產(chǎn)物的 3D 構(gòu)象,并以其適當(dāng)?shù)姆较蜃鳛檩斎?,這需要大量的努力和計(jì)算成本。
近日,韓國科學(xué)技術(shù)院(KAIST)的研究人員提出了一種基于隨機(jī)擴(kuò)散方法的生成方法,即 TSDiff,用于僅從 2D 分子圖預(yù)測 TS 幾何形狀。TSDiff 在準(zhǔn)確性和效率方面均優(yōu)于現(xiàn)有的具有 3D 幾何形狀的 ML 模型。
此外,它能夠?qū)Ω鞣N TS 構(gòu)象進(jìn)行采樣,因?yàn)樗谟?xùn)練中學(xué)習(xí)不同反應(yīng)的 TS 幾何分布。因此,與參考數(shù)據(jù)庫相比,TSDiff 能在較低的勢壘高度找到更有利的反應(yīng)途徑。這些結(jié)果表明,TSDiff 在高效、可靠的 TS 探索方面顯示出巨大的潛力。
該研究以「Diffusion-based generative AI for exploring transition states from 2D molecular graphs」為題,于 2024 年 1 月 6 日發(fā)布在《Nature Communications》上。
過渡態(tài)研究現(xiàn)狀
過渡態(tài)是指一種瞬態(tài)分子構(gòu)型,位于反應(yīng)物通過最小能量路徑到達(dá)產(chǎn)物的能壘之上,對應(yīng)于勢能面(PES)上的鞍點(diǎn)。識別 TS 是化學(xué)反應(yīng)分析中的一項(xiàng)重要任務(wù)。盡管 TS 幾何形狀由于其瞬態(tài)性質(zhì)而難以通過實(shí)驗(yàn)觀察,但可以使用量子化學(xué)計(jì)算方法獲得它們。
在過去的幾十年里,開發(fā)了各種 TS 優(yōu)化技術(shù)并應(yīng)用于許多化學(xué)反應(yīng),從而提供了對不同化學(xué)現(xiàn)象的見解。
TS 優(yōu)化方法主要有兩大類:單端方法和雙端方法,具體取決于輸入類型。前者依賴于一組反應(yīng)物的 3D 幾何形狀或估計(jì)的 TS。雙端方法利用反應(yīng)物和產(chǎn)物的 3D 幾何形狀。雖然這些傳統(tǒng)方法在實(shí)踐中被廣泛使用,但它們需要大量的計(jì)算成本,并且經(jīng)常出現(xiàn)收斂問題,使得 TS 探索成為一項(xiàng)相當(dāng)艱巨的任務(wù)。
最近,人們對使用機(jī)器學(xué)習(xí) (ML) 方法來研究 TS 越來越感興趣,目的是降低傳統(tǒng)方法的高成本。例如,已經(jīng)進(jìn)行了大量研究來直接估計(jì)勢壘高度。然而,該研究重點(diǎn)關(guān)注 TS 幾何形狀的預(yù)測。
傳統(tǒng)方法和機(jī)器學(xué)習(xí)方法都需要為 3D 分子幾何形狀進(jìn)行適當(dāng)?shù)妮斎霚?zhǔn)備。然而,眾所周知,傳統(tǒng)方法的結(jié)果對輸入結(jié)構(gòu)很敏感。機(jī)器學(xué)習(xí)方法還采用反應(yīng)物和產(chǎn)物的 3D 構(gòu)象作為輸入。因此,它們不可避免地會遇到相同的輸入靈敏度問題。
隨機(jī)生成模型:TSDiff
為了解決這個(gè)問題,KAIST 研究人員提出了這是一種機(jī)器學(xué)習(xí)模型——TSDiff,可以學(xué)習(xí) TS 構(gòu)象和 2D 分子圖之間的直接映射。因此,人們可以跳過構(gòu)象和方向的正確選擇。
此外,TSDiff 可以采用隨機(jī)擴(kuò)散方法從 2D 圖中生成各種可能的 TS 構(gòu)象,可靠性高。因此,TSDiff 可以在整個(gè) TS 生成過程中最大限度地減少用戶的工作量,并在不直接考慮構(gòu)象的情況下探索多種反應(yīng)途徑,從而實(shí)現(xiàn)高效率。
研究人員使用 Grambow 的數(shù)據(jù)集評估了 TSDiff 的性能。盡管簡化了 2D 圖的輸入,但與依賴 3D 幾何信息的現(xiàn)有方法相比,TSDiff 的準(zhǔn)確率最高。
TSDiff 是一個(gè)隨機(jī)生成模型,這意味著每次采樣都會生成不同的幾何形狀。TSDiff 生成的不同幾何形狀對應(yīng)于可以從相同的 2D 反應(yīng)圖構(gòu)建的特定 TS 構(gòu)象。例如,下圖顯示了與測試集中三個(gè)反應(yīng)的特定構(gòu)象和參考幾何形狀相對應(yīng)的幾個(gè)生成的幾何形狀。
通過基于 DFT 的量子化學(xué)計(jì)算驗(yàn)證了 TSDiff 生成的多個(gè) TS 構(gòu)象的有效性。首先,對生成的幾何形狀進(jìn)行鞍點(diǎn)優(yōu)化,得到具有單一虛振動頻率的 TS 幾何形狀。隨后進(jìn)行內(nèi)稟反應(yīng)坐標(biāo) (IRC) 計(jì)算,以驗(yàn)證 TS 幾何形狀是否對應(yīng)于給定的圖定義的反應(yīng)。TSDiff 在此驗(yàn)證中取得了 90.6% 的極高成功率,顯示了其作為初始 TS 幾何猜測器的可靠性。
基于這些結(jié)果,研究人員表示:「我們期望 TSDiff 能夠極大地減輕 TS 探索過程中耗時(shí)的試錯(cuò)過程。我們還在鞍點(diǎn)發(fā)現(xiàn)了 2303 個(gè)新的 TS 構(gòu)象,而不是使用 TSDiff 對測試集中的 1197 個(gè)反應(yīng)進(jìn)行八輪采樣。其中一些對應(yīng)于比參考文獻(xiàn)更低的勢壘高度,表明更有利的反應(yīng)途徑?!?/span>
未來潛力
TSDiff 的主要優(yōu)點(diǎn)之一是它能夠在不考慮反應(yīng)物和產(chǎn)物的構(gòu)象及其排列的情況下找到 TS。由于 TSDiff 不依賴于特定構(gòu)象,因此它允許使用更通用的方法在圖定義的反應(yīng)中有效探索 TS。
TSDiff 能夠有效捕獲非反應(yīng)坐標(biāo)和不同反應(yīng)坐標(biāo)中可旋轉(zhuǎn)鍵產(chǎn)生的 TS 構(gòu)象。此外,TSDiff 也被證明是一個(gè)有效的初始 TS 猜測器,在后續(xù) TS 優(yōu)化過程中只需要少量的強(qiáng)制調(diào)用??偟膩碚f,該研究結(jié)果證明了 TSDiff 作為高效可靠的 TS 探索的有前途的方法的潛力。
這些發(fā)現(xiàn)表明,隨機(jī)擴(kuò)散方法可以在平衡狀態(tài)下準(zhǔn)確地創(chuàng)建多種構(gòu)象異構(gòu)體,可擴(kuò)展到 TS 探索。
然而,研究也有局限性,特別是它目前對有機(jī)反應(yīng)的限制。盡管存在無機(jī)數(shù)據(jù)庫,但缺乏大型無機(jī)反應(yīng)數(shù)據(jù)庫限制了機(jī)器學(xué)習(xí)方法在該領(lǐng)域的適用性。
隨著未來數(shù)據(jù)的不斷積累,研究人員表示 TSDiff 的用途將擴(kuò)大到涵蓋更廣泛的化學(xué)反應(yīng),包括涉及無機(jī)物質(zhì)的化學(xué)反應(yīng)。
原創(chuàng)文章,作者:計(jì)算搬磚工程師,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://m.xiubac.cn/index.php/2024/01/12/8c3e95acfd/