有效催化氧還原和析出反應(yīng)的新材料對(duì)于促進(jìn)固體氧化物燃料電池和電解槽(SOFC/SOEC)技術(shù)的廣泛采用至關(guān)重要。威斯康星大學(xué)麥迪遜分校的Jacobs研究員團(tuán)隊(duì)開發(fā)了機(jī)器學(xué)習(xí) (ML) 模型來(lái)預(yù)測(cè)對(duì) SOFC/SOEC 應(yīng)用至關(guān)重要的鈣鈦礦催化特性,包括氧表面交換、氧擴(kuò)散率和面積比電阻 (ASR)。這些模型基于簡(jiǎn)單計(jì)算的基本特征,比基于從頭推導(dǎo)特征的最佳模型更準(zhǔn)確、更快,可能消除基于描述符的篩選中從頭計(jì)算的需要。該模型還被用于篩選超過(guò) 1900 萬(wàn)種鈣鈦礦,以開發(fā)一系列有前途的廉價(jià)、地球豐富、穩(wěn)定和高性能材料。
該研究中所有機(jī)器學(xué)習(xí)模型的擬合和評(píng)估均使用材料科學(xué)機(jī)器學(xué)習(xí)工具包(MASTML)進(jìn)行。對(duì)于主文中所示的催化性能擬合,該研究評(píng)估了隨機(jī)森林、梯度提升回歸器、極端梯度提升(XGBoost)、高斯過(guò)程回歸(GPR)和神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)催化性能值方面的有效性。該研究發(fā)現(xiàn)隨機(jī)森林、梯度提升和XGBoost模型在性能上表現(xiàn)相當(dāng),其中隨機(jī)森林在所有性能指標(biāo)上稍微優(yōu)于其他模型。
此外,該研究發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型(使用Zhai等人推薦的架構(gòu))在ASR評(píng)估上表現(xiàn)不佳,而GPR在ASR評(píng)估上與隨機(jī)森林的性能相似。神經(jīng)網(wǎng)絡(luò)模型由4層組成,每層分別有16、12、8和4個(gè)神經(jīng)元,使用tanh激活函數(shù),并使用scikit-learn中的MLPRegressor模型(在MAST-ML中運(yùn)行)進(jìn)行構(gòu)建。GPR模型的核函數(shù)設(shè)置為ConstantKernel?Matern+WhiteKernel。隨機(jī)森林模型由250個(gè)單獨(dú)的決策樹估計(jì)器組成。鈣鈦礦組成使用元素進(jìn)行特征化,從MAST-ML的ElementalFeatureGenerator類中生成的屬性。
簡(jiǎn)而言之,該特征生成器使用了一組最初來(lái)自MAGPIE數(shù)據(jù)庫(kù)的元素屬性,但在Wu等人和Lu等人的作品中進(jìn)行了擴(kuò)展,并對(duì)這些特征進(jìn)行了最大值、最小值、差值和組成加權(quán)平均值等基本算術(shù)運(yùn)算。對(duì)于ASR的機(jī)器學(xué)習(xí)模型,測(cè)量中使用的電解質(zhì)(即YSZ和ScSZ基于氧化鋯,GDC和SDC基于二氧化鈰,LSGM基于鈣鈦礦)也被編碼為一種特征。通過(guò)隨機(jī)森林模型的特征重要性排序,選擇了最相關(guān)的一組特征。
3.1 機(jī)器學(xué)習(xí)取代電子結(jié)構(gòu)描述符進(jìn)行催化特性預(yù)測(cè)
該研究使用 Jacobs 等人建立的鈣鈦礦催化性能數(shù)據(jù)庫(kù):揭秘749個(gè)數(shù)據(jù)點(diǎn)、299種成分的奧秘。該數(shù)據(jù)庫(kù)包含37種化學(xué)元素(不含O),La、Sr、Ba成為主要出現(xiàn)的元素,Co和Fe是最常見的過(guò)渡金屬,Nb是最常見的非3d過(guò)渡金屬。數(shù)據(jù)涵蓋氧示蹤劑、化學(xué)表面交換系數(shù)k和kchem、示蹤劑和化學(xué)氧擴(kuò)散系數(shù)D和Dchem,以及ASR值。該研究以T=500°C構(gòu)建隨機(jī)森林ML模型,通過(guò)隨機(jī)5倍CV評(píng)估模型誤差,采用MAST-ML工具包進(jìn)行模型擬合與評(píng)估。所有模型以元素屬性組合作為特征,可快速預(yù)測(cè)新化合物性能。此外,該研究也使用隨機(jī)5倍CV評(píng)估擬合O p帶中心的線性模型的誤差,以便與之前的研究結(jié)果進(jìn)行比較。
圖1. 機(jī)器學(xué)習(xí)模型隨機(jī)交叉驗(yàn)證評(píng)估將 DFT 計(jì)算的 O p 帶中心描述符的性能與使用基本特征的線性模型和隨機(jī)森林模型進(jìn)行比較(T = 500 °C)。k*和kchem的單位是cm s?1,D*和Dchem的單位是cm2 s?1,ASR的單位是Ohm-cm2。誤差線是 5 倍 CV 的 25 個(gè)分割中計(jì)算出的 MAE 平均值的標(biāo)準(zhǔn)誤差。
3.2 具有低誤差、校準(zhǔn)良好的不確定性和有效的瞬態(tài)材料預(yù)測(cè)的 ASR 機(jī)器學(xué)習(xí)模型
圖2詳細(xì)展示了該研究的ML模型在ASR預(yù)測(cè)方面的性能。該研究發(fā)現(xiàn),最有效的ASR模型采用了元素特征、電解質(zhì)類型的one-hot編碼以及ASR的阿倫尼烏斯能壘的單獨(dú)ML模型預(yù)測(cè)組成的特征。相比之下,僅使用元素特征和one-hot電解質(zhì)類型編碼的模型性能較差。圖2A和3B分別顯示了適合所有數(shù)據(jù)(完全擬合)并通過(guò)隨機(jī)5倍CV評(píng)估的隨機(jī)森林ML模型的奇偶圖。在這些奇偶校驗(yàn)圖中,藍(lán)點(diǎn)代表包含4個(gè)或更少獨(dú)立實(shí)驗(yàn)測(cè)量值的材料,綠點(diǎn)代表具有超過(guò)4個(gè)測(cè)量值的“經(jīng)過(guò)充分研究”的材料。之所以對(duì)經(jīng)過(guò)充分研究的材料進(jìn)行分離,是因?yàn)樵搱F(tuán)隊(duì)之前的工作表明這些材料的特性更容易擬合,可能是因?yàn)樗鼈兺ㄟ^(guò)平均多次測(cè)量而降低了噪聲。奇偶圖中各點(diǎn)上的誤差線是根據(jù)ML預(yù)測(cè)校準(zhǔn)的不確定性估計(jì)。由于該研究的隨機(jī)森林模型是決策樹的集合,因此該研究可以通過(guò)計(jì)算各個(gè)樹的預(yù)測(cè)的標(biāo)準(zhǔn)差來(lái)獲得每個(gè)預(yù)測(cè)的不確定性。這種方法提供了預(yù)測(cè)不確定性的簡(jiǎn)單集合估計(jì),但無(wú)法先驗(yàn)地判斷這種不確定性估計(jì)本身是否準(zhǔn)確。該研究C愛用Palmer等人的方法開發(fā)了校準(zhǔn)的不確定性估計(jì),并證明這些校準(zhǔn)的不確定性估計(jì)是相當(dāng)準(zhǔn)確的。
從圖 2A 中的完全擬合模型來(lái)看,該研究的 ML 模型能夠準(zhǔn)確地?cái)M合ASR 數(shù)據(jù)庫(kù),并且校準(zhǔn)的誤差線往往與 y = x 線相交,這代表了完美的預(yù)測(cè)。從圖 2B 中的 5 倍 CV 結(jié)果來(lái)看,與完全擬合相比,定量預(yù)測(cè)質(zhì)量有所降低,對(duì)于該研究數(shù)據(jù)庫(kù)中最低(最高)ASR 值的真實(shí) ASR 值存在一定程度的高估(低估)。從材料篩選的角度來(lái)看,在最低值范圍內(nèi)高估 ASR 并不存在問(wèn)題,因?yàn)樗砻?ASR 預(yù)測(cè)可能保守地高于最終的真實(shí)值,從而最大限度地減少不良假陽(yáng)性預(yù)測(cè)的可能性。在SI材料中,還提供了來(lái)自 Zhai 等人的工作的用于擬合最佳神經(jīng)網(wǎng)絡(luò)架構(gòu)的 5 倍 CV 結(jié)果,以及高斯過(guò)程回歸 (GPR) 模型(擬合的詳細(xì)信息在 S1 節(jié)中) 支持信息)。簡(jiǎn)而言之,該研究發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型比隨機(jī)森林?jǐn)M合更差,而 與GPR 模型的質(zhì)量相當(dāng)。
在圖 2C 中,該研究使用 ML 回歸模型來(lái)分類特定材料的對(duì)數(shù) ASR 值是否低于給定閾值的問(wèn)題。該研究使用圖 2B 中的 5 倍 CV 結(jié)果和樸素模型進(jìn)行此分類,其中樸素模型每次只是猜測(cè)極低的 ASR 值,因此總是預(yù)測(cè)低 ASR 類別。結(jié)果表明,對(duì)于 500 °C 下 log ASR < 0.7 Ohm-cm2 的材料, ML 回歸模型的 F1 分類得分為 0.81,這代表了性能相對(duì)較高的材料。即使是樸素的模型,在 log ASR 為 0.7 Ohm-cm2 時(shí)也顯示出 0.63 的不錯(cuò)的 F1 分?jǐn)?shù),該研究認(rèn)為這是 ASR 數(shù)據(jù)庫(kù)主要包含低 ASR 值的結(jié)果。
圖2. 用于預(yù)測(cè) T = 500 °C 時(shí)對(duì)數(shù) ASR 的 ML 模型性能摘要。A) 完全擬合所有數(shù)據(jù)的奇偶圖,B) 5 倍 CV 評(píng)估,C) 用于預(yù)測(cè)對(duì)數(shù) ASR 低于給定閾值的材料的 ASR 模型分類準(zhǔn)確性,D) 時(shí)間交叉驗(yàn)證分類評(píng)估。
3.3 利用機(jī)器學(xué)習(xí)篩選新的有前景的鈣鈦礦催化劑
在這一節(jié),研究使用了前文討論的ASR ML模型、以及利用pymatgen包計(jì)算的材料成本和鈣鈦礦穩(wěn)定性的獨(dú)立ML模型,來(lái)篩選潛在的新型鈣鈦礦催化劑。穩(wěn)定性模型采用隨機(jī)森林模型和元素特征,對(duì)2844種鈣鈦礦氧化物進(jìn)行預(yù)測(cè),使用Ma等人的數(shù)據(jù)庫(kù)作為凸殼能量測(cè)量的依據(jù)??傮w而言,該研究對(duì)一個(gè)龐大的搜索空間進(jìn)行了枚舉,其中A位點(diǎn)最多包含3種元素,B位點(diǎn)最多包含4種元素,涵蓋了50種元素,共計(jì)超過(guò)1900萬(wàn)種材料。
為了尋找潛在的新材料,該研究設(shè)定了篩選標(biāo)準(zhǔn),包括成本、穩(wěn)定性和ASR活性的閾值。成本閾值設(shè)置為與商業(yè)材料La0.6Sr0.4Co0.2Fe0.8O3(LSCF)相當(dāng),即每公斤133.67美元。對(duì)于活性,將LSCF(500°C)的log ASR值閾值設(shè)定為1.33 Ohm-cm2,以及代表性頂級(jí)性能材料Ba0.5Sr0.5Co0.8Fe0.2O3的log ASR(500°C)閾值為0.21 Ohm-cm2。穩(wěn)定性的閾值參考了Zhai等人的工作,他們的頂級(jí)性能材料Sr0.9Cs0.1Co0.9Nb0.1O3(SCCN)在550°C下穩(wěn)定運(yùn)行800多個(gè)小時(shí),沒(méi)有觀察到任何性能損失。該研究的穩(wěn)定性模型預(yù)測(cè)SCCN在500°C時(shí)的值為93.3 meV原子-1,將其作為篩選的穩(wěn)定性閾值。在整個(gè)分析過(guò)程中,該研究假設(shè)使用二氧化鈰電解質(zhì)來(lái)預(yù)測(cè)ASR。
圖3. 顯示篩選材料分布的小提琴圖,其中第一次篩選是 A) 篩選材料成本,B) 篩選材料穩(wěn)定性,以及 C) 篩選 ASR。每個(gè)分布上方的數(shù)字表示通過(guò)給定篩選組合的材料數(shù)量。
圖3 包含小提琴圖,顯示了連續(xù)應(yīng)用篩選標(biāo)準(zhǔn)時(shí)成本(圖3A)、穩(wěn)定性(圖3B)和 500 °C 下的預(yù)測(cè)對(duì)數(shù) ASR(圖3C)的分布,從每種情況下繪制的標(biāo)準(zhǔn)開始 。從圖3中,可以看到2453872、1393424和2135396材料分別通過(guò)了成本、穩(wěn)定性和ASR的篩選標(biāo)準(zhǔn),這相當(dāng)于原始19072821考慮材料的12.9%、7.3%和11.2%, 穩(wěn)定性是最嚴(yán)格的篩選標(biāo)準(zhǔn)。共有 57579 種材料(0.30%)通過(guò)了成本和穩(wěn)定性篩選,53210 種(0.28%)材料同時(shí)通過(guò)了穩(wěn)定性和 ASR 篩選。最終,9135 種(0.05%)材料通過(guò)了所有篩選標(biāo)準(zhǔn)。SI材料中提供了包含這些 9135 材料的成分、計(jì)算成本以及預(yù)測(cè)穩(wěn)定性和 ASR 值的電子表格。
該研究利用ASR模型和預(yù)測(cè)清單進(jìn)行大量材料評(píng)估和比較。首先,該研究檢查每個(gè)篩選標(biāo)準(zhǔn)(成本、穩(wěn)定性和ASR值)中最有利的被篩選材料。通過(guò)檢查這個(gè)篩選有前景的材料清單,發(fā)現(xiàn)在成本、穩(wěn)定性和活性方面最佳的材料分別是BaFe0.75Cu0.125Zr0.125O3(1.15美元/公斤,500°C下log ASR = 0.12 Ohm-cm2)、BaFe0.5Co0.25Mo0.25O3(原子能量18.0 meV,500°C下log ASR = -0.02 Ohm-cm2)和SrCo0.75Nb0.125Ta0.125O3(SCNT)(500°C下log ASR = -0.43 Ohm-cm2)。值得注意的是,該研究篩選出的最活躍材料SCNT已經(jīng)被確認(rèn)具有較高性能。其次,通過(guò)檢查該研究的低ASR材料清單,尋找與已知材料在成分上有所不同的新材料,這使它們值得進(jìn)一步研究。檢查該研究清單中前幾名材料候選者中,具有與已知材料相比較獨(dú)特組合的高性能材料,發(fā)現(xiàn)這些材料具有K、Bi、Y、Ni和Cu等元素的不尋常組合,表明這些相對(duì)未探索的組成可能值得進(jìn)一步關(guān)注。例如,材料SrZr0.125Nb0.125Co0.625Cu0.125O3(SZNCCu)、K0.25Sm0.125Sr0.625Nb0.125Ta0.125Co0.75O3(KSmSCNT)和Bi0.125Sr0.875Y0.125Ni0.125Co0.75O3(BiSYNC)在500°C下預(yù)測(cè)的log ASR值非常低,分別為-0.37、-0.33和-0.25 Ohm-cm2。
這項(xiàng)工作開發(fā)了一個(gè)完全以數(shù)據(jù)為中心的機(jī)器學(xué)習(xí)方法,用于預(yù)測(cè)鈣鈦礦氧催化和傳輸性能,利用了迄今為止最大的鈣鈦礦氧催化性能數(shù)據(jù)庫(kù),其中包括氧表面交換速率、氧擴(kuò)散率和ASR數(shù)據(jù)。該研究表明,利用易于獲取的元素特征擬合的隨機(jī)森林機(jī)器學(xué)習(xí)模型可以產(chǎn)生與使用DFT計(jì)算的O p-帶中心線性相關(guān)性相當(dāng)或更低的交叉驗(yàn)證平均MAE值。這些機(jī)器學(xué)習(xí)模型的評(píng)估速度比使用每種材料的O p-帶中心描述符的DFT計(jì)算快幾個(gè)數(shù)量級(jí),為快速篩選鈣鈦礦催化性能提供了途徑。
團(tuán)隊(duì)利用該研究的ASR機(jī)器學(xué)習(xí)模型,篩選了超過(guò)1900萬(wàn)種鈣鈦礦組合,并提出了許多新的有前途的材料,這些材料比商業(yè)材料LSCF更便宜,比性能良好的材料SCCN更穩(wěn)定,并預(yù)測(cè)在T=500°C時(shí)具有異常低的ASR值,值得進(jìn)一步研究。
Jacobs R, Liu J, Abernathy H, et al. Machine Learning Design of Perovskite Catalytic Properties[J]. Advanced Energy Materials, 2024: 2303684.DOI:10.1002/aenm.202303684
原創(chuàng)文章,作者:Jenny(小琦),如若轉(zhuǎn)載,請(qǐng)注明來(lái)源華算科技,注明出處:http://m.xiubac.cn/index.php/2024/03/17/9517d563ee/