百度螺旋槳團隊成果登NMI:對化合物3D建模
日前,國際知名機器學(xué)習(xí)學(xué)術(shù)期刊Nature Machine Intelligence(NMI,近2年影響因子≈16.649)在線發(fā)表了百度生物計算團隊(“螺旋槳”團隊)的最新研究成果,論文提出基于空間結(jié)構(gòu)的化合物表征學(xué)習(xí)方法,即“幾何構(gòu)象增強AI算法”(GEM模型),將化合物的幾何結(jié)構(gòu)信息引入自監(jiān)督學(xué)習(xí)和分子表示模型,對化合物進行“3D建模”,以預(yù)測化合物分子的性質(zhì)屬性。其在藥物篩選中的應(yīng)用,可在數(shù)小時內(nèi)完成傳統(tǒng)仿真方法1年的工作量,效率提升上千倍,有望大幅降低藥物研發(fā)的時間投入和成本投入。
作為藥物研發(fā)的關(guān)鍵一環(huán),候選化合物的性質(zhì)預(yù)測相當(dāng)于為臨床實驗“排雷”,即提前篩選掉毒副作用高、人體不易吸收代謝等的化合物。此前,這項工作只能通過傳統(tǒng)仿真實驗進行,成本高且耗時長。后來,研究人員引入深度學(xué)習(xí),但傳統(tǒng)的深度學(xué)習(xí)方法大多基于序列或二維圖結(jié)構(gòu)建模,缺乏對化合物三維空間結(jié)構(gòu)信息的利用,這會丟失一部分空間信息,導(dǎo)致化合物性質(zhì)預(yù)測結(jié)果的偏差。為更好地預(yù)測化合物性質(zhì),亟需引入化合物的三維空間信息。
百度螺旋槳團隊提出的GEM模型,正是在這一點上實現(xiàn)了突破。論文稱,他們開創(chuàng)性的工作,是業(yè)界首次將化合物性質(zhì)預(yù)測從“2D建?!蓖七M到“3D建模”。同時,團隊通過引入預(yù)訓(xùn)練技術(shù)和利用大量無標(biāo)注的化合物數(shù)據(jù),通過自監(jiān)督學(xué)習(xí)來構(gòu)建GEM模型的底層能力,有望打造小分子藥物研發(fā)領(lǐng)域的模型底座,解決小分子藥物活性預(yù)測、成藥性預(yù)測等藥物設(shè)計的核心問題,真正加速藥物特別是創(chuàng)新藥物的發(fā)現(xiàn)過程。
基于空間結(jié)構(gòu)的化合物表征學(xué)習(xí)方法(GEM)的整體框架 百度供圖
論文進一步發(fā)布了該模型的實驗效果,結(jié)果顯示,GEM模型在14個學(xué)術(shù)界公認(rèn)的應(yīng)用任務(wù)數(shù)據(jù)集(包括抑制 HIV 艾滋病病毒復(fù)制能力的數(shù)據(jù)集、小分子的生物活性數(shù)據(jù)集、血腦屏障滲透數(shù)據(jù)集等)上取得最佳結(jié)果,超越斯坦福大學(xué)等提出的模型效果。其中,GEM模型在“回歸”任務(wù)上相對現(xiàn)有方法指標(biāo)提升8.8%,在“分類”任務(wù)上指標(biāo)相對提升4.7%,并在自監(jiān)督學(xué)習(xí)方法上的消融實驗中證明了其有效性。
目前,開源社區(qū)GitHub上已經(jīng)開源了GEM模型完整代碼。研究人員表示,GEM模型目前已經(jīng)在多個合作伙伴的研發(fā)管線中實現(xiàn)了商業(yè)化落地。這表明,人們有望通過AI技術(shù)探索雙靶點抑制劑新的研發(fā)范式,為癌癥病人和自身免疫性疾病病人提供更有效的治療藥物。
此外,研究人員指出,該方法還有助于高效測量“藥物—靶標(biāo)”的相互作用,進而用于加速新藥研發(fā)、發(fā)掘老藥新用途、探索多種藥物聯(lián)合使用等,這有助于降低藥品抗藥性和毒副作用,甚至療治新病癥。
該項研究由百度螺旋槳PaddleHelix團隊獨立完成。百度基于飛槳打造的生物計算平臺“螺旋槳PaddleHelix”,致力于為生物醫(yī)藥專家與學(xué)者提供“AI+生物計算”的模型工具和解決方案,服務(wù)于新藥研發(fā)、疫苗設(shè)計、精準(zhǔn)醫(yī)療等場景。
-
實驗室動態(tài)
-
焦點事件
-
焦點事件
-
焦點事件
-
焦點事件