眾所周知,蛋白質(zhì)是生命的基石。對蛋白質(zhì)獨特的三維結(jié)構以及其動力學性質(zhì)的探索不僅有助于我們解讀生命密碼,更有助于加速藥物研發(fā)。近期,深勢科技將基于神經(jīng)網(wǎng)絡的強化動力學方法(Reinforced Dynamics, RiD)進一步應用于擁有更高維集合變量(Collective Variables, CVs)的體系中,這一研究將推進蛋白質(zhì)結(jié)構采樣、結(jié)構精修或環(huán)區(qū)優(yōu)化等工作的進行,讓研究人員能夠通過計算方法向蛋白質(zhì)的天然狀態(tài)更近一步。

(論文:Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics)
此項成果于近日登上Nature旗下專注于計算科學的頂級期刊《自然-計算科學》(Nature Computational Science),該期刊關注最新計算方法的發(fā)展及其如何在各學科中解決實際問題。論文題為《利用自適應強化動力學對高維自由能面進行高效采樣》(Efficient sampling of high-dimensional free energy landscapes using adaptive reinforced dynamics),據(jù)了解,文章中使用了超過100個集合變量加速采樣進程,此前的采樣方法從未處理過如此高維的集合變量。該文章作者目前均在深勢科技團隊。這是繼12月8日推出蛋白質(zhì)結(jié)構預測工具Uni-Fold,并開源訓練、推理代碼后,深勢科技團隊的又一重磅成果。

(RiD工作流,RiD方法應用在超過100個集合變量的體系上)
神經(jīng)網(wǎng)絡加持下,對蛋白結(jié)構的”精雕細琢”再進一步
幾十年來,科學家們通過各種實驗手段解析了十幾萬個蛋白質(zhì)結(jié)構,但這相較于已經(jīng)測序的數(shù)十億計蛋白質(zhì)來說還遠遠不夠。實驗方法成本高、周期長,因此能否用計算方法還原蛋白質(zhì)生理狀態(tài)并加速研究工作成為計算生物學中最具挑戰(zhàn)性的問題之一。
盡管在2020年的國際蛋白質(zhì)結(jié)構預測頂級競賽CASP(Critical Assessment of protein Structure Prediction)中,來自DeepMind的AI算法AlphaFold2的表現(xiàn)引發(fā)生物界巨大轟動。但相比于蛋白質(zhì)真實的生理狀態(tài),AlphaFold2的預測結(jié)果仍需要進一步的蛋白結(jié)構精修。
目前在蛋白質(zhì)結(jié)構優(yōu)化中,基于經(jīng)典分子動力學(Molecular Dynamics, MD)的優(yōu)化方案在近兩期的CASP上都取得了優(yōu)異的結(jié)果。但是,經(jīng)典分子動力學模擬方法在蛋白質(zhì)體系中采樣效率低,而傳統(tǒng)增強采樣算法又面臨著計算量大、難以選取集合變量以及維數(shù)災難的問題。強化動力學(Reinforced Dynamics,RiD)方法則可以借助神經(jīng)網(wǎng)絡,處理幾十甚至上百維的集合變量,使其能夠應用在復雜體系中。RiD方法在蛋白質(zhì)結(jié)構優(yōu)化問題上處理了超過100個集合變量,讓經(jīng)典分子動力學方法無法得到的蛋白質(zhì)天然結(jié)構在強化動力學方案下成為現(xiàn)實。

(在R0974s1, R0986s1 和 R1002-D2 三個案例中的蛋白結(jié)構精修結(jié)果)
在CASP13比賽中三個典型例子(R0974s1, R0986s1 和 R1002-D2)上,RiD做到了大幅提升。相比于初始結(jié)構,RiD優(yōu)化后的結(jié)構平均提升了14.6點GDT-HA分數(shù),其中最高分數(shù)分別達到了92.4,82.6和79.7。同時,優(yōu)化結(jié)果具有良好的魯棒性(圖a和b)。特別地,在R1002-D2的例子上,經(jīng)典分子動力學模擬只采樣的很小的區(qū)域(圖c 紫紅色區(qū)域),RiD可以從初始結(jié)構(圖c 黑色X,圖d)經(jīng)過去折疊(圖e),最終模擬到天然狀態(tài)結(jié)構(圖c 藍色X,圖f)。
蛋白質(zhì)在生物體內(nèi)是不斷運動的,目前描述蛋白質(zhì)構象系綜的最佳方式之一是借助分子模擬手段。對于生物大分子體系的高效采樣是分子模擬的一個關鍵問題,RiD作為這一問題的出色解決方案,為多個領域的突破帶來可能。對于藥物設計而言,RiD能夠在更多的場景發(fā)揮重要作用:探尋構象變化中的隱藏口袋和別構口袋,困難藥物靶點中固有無序蛋白的構象采樣,抗體環(huán)區(qū)優(yōu)化等。對于藥物科研人員來說,這些難題的解決能有效提升藥物研發(fā)效率。
為了方便學術開發(fā)與應用,深勢科技團隊已將RiD方法重構為開源軟件供用戶使用(https://github.com/deepmodeling/rid-kit)。同時深勢科技也針對藥物設計場景,對RiD進行了進一步的開發(fā)和優(yōu)化,集成于旗下一站式計算輔助藥物設計平臺Hermite中。用戶可通過Hermite-ProteinRefine對輸入的蛋白質(zhì)進行結(jié)構優(yōu)化,獲得更接近天然狀態(tài)的蛋白結(jié)構。

(Hermite界面-通道蛋白在膜里面)
去年,深勢科技核心成員的工作開辟了“AI+物理模型+高性能計算”的科學計算新范式,一舉斬獲“計算應用領域諾貝爾獎”、國際高性能計算應用領域最高獎項“戈登·貝爾獎”。 如今RiD的誕生與應用,也是深勢科技團隊“AI+物理模型+高性能計算”組合拳的極佳體現(xiàn),也是新一代分子模擬算法在藥物設計領域落地,實現(xiàn)效率與精度統(tǒng)一的例證之一。深勢科技致力于運用領跑行業(yè)的分子模擬技術,為人類文明最基礎的生命、能源、材料科學與工程研究打造新一代微尺度工業(yè)設計和仿真平臺。
Hermite作為根植于云計算的臨床前計算機輔助藥物設計平臺,能為藥物開發(fā)人員提供數(shù)據(jù)、算法、算力三位一體的一站式解決方案。除RiD模塊外,Hermite上已集成多個重量級功能,例如近期上線的蛋白質(zhì)結(jié)構預測工具Uni-Fold,在藥物優(yōu)化階段比較不同分子與蛋白靶點結(jié)合活性差別的Uni-FEP,等等。
在結(jié)構生物學領域,利用Uni-Fold、RiD等AI+計算模擬的算法,并結(jié)合冷凍電鏡等實驗手段,深勢科技正致力于打造一套模擬—AI—實驗三者聯(lián)合驅(qū)動的結(jié)構生物學解決方案,為基于結(jié)構的藥物設計提供更高的起點,加速科學家們的藥物發(fā)現(xiàn)進程。
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內(nèi)容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內(nèi)容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。