国产三级精品三级在线观看,国产高清无码在线观看,中文字幕日本人妻久久久免费,亚洲精品午夜无码电影网

?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置

?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
二維(2D)共價有機(jī)框架(COF)的帶邊位置(band-edge)對其在光催化劑和納米電子學(xué)中的應(yīng)用起著至關(guān)重要的作用。然而,由于COF結(jié)構(gòu)的多樣性和復(fù)雜性,通過第一性原理計算,在大量的二維COFs中獲得具有目標(biāo)帶邊位置的非常耗時。
為此,中國科學(xué)技術(shù)大學(xué)武曉君等人提出了一種通過結(jié)合第一性原理計算和機(jī)器學(xué)習(xí)(ML)來預(yù)測二維COFs帶邊位置的策略。在測試數(shù)據(jù)集上,預(yù)測的價帶頂(VBM)和導(dǎo)帶底(CBM)與第一性原理計算值的均方根誤差分別為0.229和0.247 eV,同時也在高階的雜化泛函上建立了線性關(guān)系,為高效預(yù)測2D COFs的帶邊位置提供了有效的工具。
圖文導(dǎo)讀
ML技術(shù)具備快速預(yù)測的能力,近年來在材料發(fā)現(xiàn)中得到了廣泛應(yīng)用。已經(jīng)開發(fā)了幾種ML模型來預(yù)測COFs的氣體吸附和分離、電催化性能、和吸附熱泵。在本研究中,作者采用第一性原理計算和機(jī)器學(xué)習(xí)方法,建立了分子前體軌道能量與二維COFs帶邊位置(VBMs和CBMs)之間關(guān)系的圖神經(jīng)網(wǎng)絡(luò)(GNN)模型。
作者從CoRE COF Database數(shù)據(jù)庫中收集到了591個實(shí)驗(yàn)合成的COF結(jié)構(gòu)(從2005年到2021年),在剔除了3D的COF、重復(fù)數(shù)據(jù)、帶有金屬離子等結(jié)構(gòu)后,剩下381個2D COF結(jié)構(gòu)(圖1a)。
之后,作者利用第一性原理,在PBE水平下計算了這381個COF結(jié)構(gòu)的帶邊位置,如圖1b-c所示。數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集(80%)和測試數(shù)據(jù)集(20%)??紤]到HSE06計算的時間成本,30個原子數(shù)小于100的2D COFs的VBM和CBM位置使用了HSE06計算(圖1d)。
對于使用HSE06計算的VBM和CBM位置的小數(shù)據(jù)集,構(gòu)建一個大的測試數(shù)據(jù)集(50%),以確保預(yù)測模型的泛化能力。所有ML方法都是在訓(xùn)練數(shù)據(jù)集中進(jìn)行訓(xùn)練的,測試數(shù)據(jù)集用于驗(yàn)證ML方法的泛化能力,并選擇性能最好的預(yù)測模型。
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
圖1.(a)數(shù)據(jù)集構(gòu)建(b)計算的VBM分布直方圖(c)計算的CBM分布直方圖(d)使用HSE06計算的CBM和VBM
訓(xùn)練ML模型需要設(shè)計好的材料描述符。由于二維COFs是用分子前體實(shí)驗(yàn)合成的,因此,作者將分子性質(zhì)作為描述符來預(yù)測二維COFs的電子結(jié)構(gòu)。分子軌道可以近似地表示為原子軌道的線性組合,因此可以用分子軌道能量作為描述符來預(yù)測用PBE計算出的VBM和CBM的位置。
描述符包括前線分子軌道及其鄰近軌道的能量,最高已占據(jù)分子軌道(HOMO),最低的未占據(jù)分子軌道(LUMO)以及HOMO和LUMO鄰近的軌道。作者用B3LYP泛函計算了這些分子軌道的能量。
考慮到二維COFs中相鄰分子構(gòu)建塊之間的相互作用影響其電子帶結(jié)構(gòu),將二維COFs的拓?fù)浣Y(jié)構(gòu)包含在描述符中。由于分子構(gòu)建塊之間的相互作用,使用無向圖來表示二維COF,構(gòu)建具有類似于2D COF拓?fù)浣Y(jié)構(gòu)的晶體圖,其中每個分子構(gòu)建塊和每個連接由一個節(jié)點(diǎn)和一條邊表示。
為了明確描述符的構(gòu)建過程,以TFB(1,3,5-三甲基苯)和聯(lián)苯胺分子組裝的BND-TFB COF為例,如圖2a所示。在無向圖中,每個TFB分子與三個聯(lián)苯胺分子相連。EHOMO-4,…,EHOMO-1,EHOMO,ELUMO,ELUMO+1…,用兩種分子的ELUMO+4作為描述符來描述分子前體,如圖2b所示。
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
圖2. (a)圖中節(jié)點(diǎn)表示分子前體,黃色節(jié)點(diǎn)代表TFB分子,藍(lán)色節(jié)點(diǎn)代表聯(lián)苯胺分子(b)分子軌道描述符
作者通過使用圖卷積網(wǎng)絡(luò)(GCNs)和圖注意網(wǎng)絡(luò)(GATs)兩個ML過程,在PBE水平上預(yù)測VBM和CBM的位置。為了得到合適的超參數(shù),使用了交叉驗(yàn)證和網(wǎng)格搜索。選擇5個指標(biāo)來評價每個ML模型的性能,包括平均絕對誤差(MAE)、均方根誤差(RMSE)、皮爾遜相關(guān)系數(shù)(R)、平均絕對分?jǐn)?shù)誤差(MAEF)和均方根分?jǐn)?shù)誤差(RMSEF)。
選擇分子描述符后,將在測試數(shù)據(jù)集中預(yù)測的VBM和CBM位置與在PBE水平的計算結(jié)果進(jìn)行比較,如圖3所示。圖3a-b中的散點(diǎn)圖顯示了GCN和GAT模型預(yù)測的VBM分布,其中大部分預(yù)測結(jié)果分布在基線附近。在98.7%的情況下,兩種模型在PBE水平上的VBM位置的相對誤差在10%以內(nèi)。
圖3c-d顯示了兩種模型預(yù)測的CBM分布。GCN和GAT模型在PBE水平上的相對誤差分別為85.7%和83.1%。相對誤差表明,GCN和GAT模型在PBE水平上對VBM位置的預(yù)測優(yōu)于CBM位置,而CBM位置的預(yù)測,GCN模型優(yōu)于GAT模型。
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
圖3. GCN(a)和GAT(b)預(yù)測的VBM的散點(diǎn)圖和誤差,GCN(c)和GAT(d)預(yù)測的CBM的散點(diǎn)圖和誤差(PBE水平)
表1總結(jié)了GCN和GAT模型在PBE水平預(yù)測VBM和CBM的MAE、RMSE、MAEF、RMSEFR值。在測試數(shù)據(jù)集中,GCN和GAT模型在PBE水平上對VBM預(yù)測的RMSE值相似,分別為0.227和0.229 eV。對應(yīng)的MAE值也相似,分別為0.175 eV和0.174 eV。GAT模型的分?jǐn)?shù)誤差值(RMSEF和MAEF)小于GCN模型。對于PBE水平的CBM預(yù)測,GCN模型的RMSE (0.247 eV)和MAE(0.174 eV)均小于GAT模型。
GAT模型的分?jǐn)?shù)誤差大于GCN模型,可能是由于離群數(shù)據(jù)的相對誤差大于20%。在半導(dǎo)體中,CBM的絕對值通常小于VBM的絕對值。即使CBM和VBM的預(yù)測也具有相似的誤差值,并且由于前者的分母較小,CBM預(yù)測的分?jǐn)?shù)誤差大于VBM預(yù)測的分?jǐn)?shù)誤差。
表1列出了R的計算值,其范圍為82%~87%,表明VBM和CBM的預(yù)測與PBE計算結(jié)果高度相關(guān),GAT模型適用于VBM的預(yù)測,GCN模型適用于CBM的預(yù)測。
表1. 預(yù)測VBM和CBM的性能統(tǒng)計(PBE水平)
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
不過,PBE泛函總是低估半導(dǎo)體的帶隙,而HSE06泛函在第一性原理計算中被廣泛用于獲得精確的電子結(jié)構(gòu)。然而,HSE06計算的時間成本巨大,阻礙了在HSE06水平上對2D COF的大規(guī)模篩選。
為此,作者創(chuàng)建了線性模型(線性回歸和嶺回歸)來探索用HSE06和PBE泛函計算的帶邊位置之間的相關(guān)性。作者以包含少于100個原子的30個2D COFs作為數(shù)據(jù)集,并使用PBE泛函計算的帶邊位置作為描述符來預(yù)測使用HSE06泛函計算的帶邊位置。圖4顯示了ML預(yù)測結(jié)果與使用HSE06計算結(jié)果的比較。
可以發(fā)現(xiàn),VBM和CBM位置的相對預(yù)測誤差均小于5%,且兩種方法的PBE泛函計算結(jié)果與HSE06泛函計算結(jié)果均表現(xiàn)出較強(qiáng)的直接線性相關(guān)性。表2列出了計算的MAE、RMSE、MAEF、RMSEFR值。這兩種方法的RMSE值都可以忽略不計,在HSE06水平上,VBM和CBM的RMSE值分別為0.089~0.090 eV和0.042~0.043 eV。RMSEF值也較小,分別為1.524%~1.532%和1.455%~1.489%。
作者進(jìn)一步建立了PBE和HSE06泛函的帶邊位置之間的線性關(guān)系,定義為CBMHSE(或VBMHSE)= a×VBMPBE+b×CBMPBE+c。對于預(yù)測HSE06水平的VBM, ab值分別為1.208和0.036。對于嶺回歸預(yù)測HSE06水平的CBM,這兩個值分別為- 0.079和1.117。
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
圖4. GCN(a)和GAT(b)預(yù)測的VBM的散點(diǎn)圖和誤差,GCN(c)和GAT(d)預(yù)測的CBM的散點(diǎn)圖和誤差(HSE06水平)
表2. 預(yù)測VBM和CBM的性能統(tǒng)計(HSE06水平)
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
然后,作者開發(fā)了一個工作流程來預(yù)測二維COFs的VBM和CBM,無需電子帶結(jié)構(gòu)計算,如圖5所示。在HSE06精度下,預(yù)測VBM和CBM的MAE值分別小于0.293和0.242 eV,該工作流程可用于加速篩選具有合適帶邊位置的2D COFs。
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置
圖5. 預(yù)測二維COFs的VBM和CBM工作流程
在中性條件下,當(dāng)CBM和VBM的位置位于H+/H2(-4.02 V)和O2/H2O(- 5.25 V)的氧化還原電位之間時,可以作為水分解的光催化劑。
如圖6所示,作者篩選出182個2D COFs適合作為水分解的光催化劑;107種2D COFs作為析氫反應(yīng)光催化劑,11種2D COFs作為析氧反應(yīng)光催化劑。此外,59個2D COFs具有大于3.10 eV的寬帶隙,可用于室溫探測器。
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置

圖6. 在HSE06水平下的2D COFs的VBM和CBM位置分布,這些COFs適用于(a)水分解,(b)僅析氫反應(yīng)和(c)僅析氧反應(yīng)

總結(jié)展望
作者報告了一種結(jié)合第一性原理計算和基于GNN的機(jī)器學(xué)習(xí)的方法,使用分子前驅(qū)體的前線分子軌道及其相鄰分子軌道預(yù)測2D COF半導(dǎo)體帶邊位置?;谒⒌腗L模型,作者以HSE06的精度預(yù)測了用于光催化水分解和納米電子學(xué)的2D COF的帶邊位置。此外,相信隨著未來COF數(shù)據(jù)集的擴(kuò)展,ML模型可以進(jìn)一步完善。
文獻(xiàn)信息
Dayong Wang, Haifeng Lv, Yangyang Wan, Xiaojun Wu, Jinlong Yang. Band-Edge Prediction of 2D Covalent Organic Framework from molecular Precursor via Machine Learning. Journal of Physical Chemistry Letters 14, 6757-6764 (2023)
https://doi.org/10.1021/acs.jpclett.3c01419
?【AI+DFT+材料】JPCL:機(jī)器學(xué)習(xí)預(yù)測二維COF材料的帶邊位置

 點(diǎn)擊閱讀原文,報名計算培訓(xùn)!


原創(chuàng)文章,作者:計算搬磚工程師,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://m.xiubac.cn/index.php/2023/10/24/1061e5205c/

(0)

相關(guān)推薦

紫云| 晋宁县| 砚山县| 鸡泽县| 秭归县| 靖边县| 龙陵县| 天峨县| 垫江县| 桂平市| 德清县| 银川市| 洛阳市| 西城区| 长葛市| 六枝特区| 海宁市| 华容县| 宁晋县| 东乌珠穆沁旗| 贞丰县| 霍林郭勒市| 松原市| 邵武市| 高青县| 诏安县| 江源县| 大厂| 赤水市| 西吉县| 武胜县| 惠东县| 峡江县| 南陵县| 正定县| 观塘区| 中山市| 铁岭县| 宜都市| 盐池县| 高阳县|