來源丨Pubmed 百度
北京時(shí)間5月2日凌晨,國際頂級(jí)學(xué)術(shù)期刊《Nature》正刊發(fā)表了百度與合作單位在生物計(jì)算領(lǐng)域的重磅突破性成果——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出mRNA序列優(yōu)化算法LinearDesign。
這是中國科技企業(yè)首次以第一完成單位的身份在《Nature》雜志發(fā)表論文。
鑒于論文對(duì)生物醫(yī)學(xué)領(lǐng)域的重要性,Nature雜志在正式排版之前先將預(yù)覽版快車道上線 (accelerated article preview),這也是AI應(yīng)用于mRNA領(lǐng)域的首篇CNS主刊論文。
mRNA疫苗被公認(rèn)為是遏制COVID-19的可行工具, 但mRNA疫苗和藥物仍面臨一些挑戰(zhàn)。其中如何高效設(shè)計(jì)出穩(wěn)定、成藥性更好的mRNA序列,是mRNA療法研究領(lǐng)域的難點(diǎn)之一。
百度運(yùn)用自然語言處理中網(wǎng)格解析(Lattice Parsing)技術(shù),對(duì)mRNA疫苗序列進(jìn)行優(yōu)化,提升疫苗穩(wěn)定性和有效性。LinearDesign算法巧妙地將序列設(shè)計(jì)的海量計(jì)算簡(jiǎn)化為自然語言處理中的經(jīng)典問題,讓“大海撈針”變成了“按圖索驥”。
以新冠病毒Spike蛋白為例,若采用遍歷法尋找一條穩(wěn)定序列,需要查看10的632次方個(gè)mRNA序列。假如由一臺(tái)超級(jí)計(jì)算機(jī)每秒計(jì)算一個(gè)序列,那么從宇宙誕生到現(xiàn)在的138億年,連潛在mRNA序列的億萬分之一都無法計(jì)算完畢,而LinearDesign算法則能在短短11分鐘之內(nèi)找到最穩(wěn)定的候選序列。
實(shí)驗(yàn)數(shù)據(jù)證明,LinearDesign算法設(shè)計(jì)序列將有助于生物醫(yī)藥公司快速研發(fā)更有效的mRNA疫苗,縮短研發(fā)周期,降低研發(fā)成本。這一算法的有效性已經(jīng)在新冠mRNA疫苗和帶狀皰疹mRNA疫苗兩種疫苗中得到驗(yàn)證。與傳統(tǒng)基準(zhǔn)相比,百度的設(shè)計(jì)顯著改善了體外 mRNA 半衰期和蛋白質(zhì)表達(dá),使體內(nèi)抗體反應(yīng)增強(qiáng)了高達(dá) 128 倍。
計(jì)算 RNA 生物學(xué)家戴夫·莫格 (Dave Mauger) 則認(rèn)為,這種新方法“非常了不起”,他曾在美國Moderna 公司工作,一家 mRNA疫苗制造商?!坝?jì)算效率確實(shí)令人印象深刻,而且比以往任何時(shí)候都更加復(fù)雜。”
截至目前,百度已打造完整的基于飛槳的生物計(jì)算平臺(tái)-螺旋槳PaddleHelix,涵蓋文心大模型-生物計(jì)算大模型,探索AI技術(shù)在小分子、蛋白/多肽、RNA等場(chǎng)景的應(yīng)用。其中生物計(jì)算等大模型屬于百度文心大模型家族中的一員。
據(jù)了解,百度文心大模型形成了系統(tǒng)性的大模型技術(shù)體系,包括自然語言處理、視覺、跨模態(tài)、生物計(jì)算等,最近火爆的文心一言就是百度自主研發(fā)的知識(shí)增強(qiáng)大語言模型。文心一言通過百度智能云對(duì)外提供服務(wù),為企業(yè)構(gòu)建自己的模型和應(yīng)用,未來醫(yī)療、工業(yè)、金融等重點(diǎn)領(lǐng)域效率將會(huì)大幅提升,快速形成新產(chǎn)業(yè)空間。
原創(chuàng)文章,作者:菜菜歐尼醬,如若轉(zhuǎn)載,請(qǐng)注明來源華算科技,注明出處:http://m.xiubac.cn/index.php/2024/01/18/1f6a37d40c/