預測出地球上幾乎所有蛋白質結構,AI工具真能加速新藥開發嗎?( 二 )


預測出地球上幾乎所有蛋白質結構,AI工具真能加速新藥開發嗎?
文章圖片
圖片來源:123RF
不過從新藥開發的整個時間周期上來說 , AlphaFold對加速藥物發現的幫助就比較有限了 。 這是因為了解蛋白質的結構只是臨床藥物開發過程中的限速步驟之一 。
專家指出 , AlphaFold并不能讓臨床試驗變得更可預測 。 不論AlphaFold能以多快的速度給出這些候選藥物的蛋白結構 , 但對蛋白結構的了解并不能減輕臨床失敗的風險 。 臨床上85%的失敗是因為選擇了錯誤的靶點 , 或者預期外的事件 , 例如候選藥物還存在免疫原性和毒理學方面的問題等等 。
此外 , 就蛋白結構預測方面來說 , AlphaFold也存在著局限性 。 其一是AlphaFold的訓練是基于蛋白質數據庫中晶體結構的瞬間快照 , 這些晶體結構實際上只是不斷運動的蛋白質的某種可能構象 。 因為蛋白質結構在其他小分子配體存在的情況下會發生變化 , 這種變化有時候是微小的 , 有時候是劇烈的 。 但AlphaFold尚未具備預測這些變化的能力 , 這也就限制了其在設計治療藥物方面的用途 。
另一大局限性在于 , AlphaFold如果要完美預測出蛋白質結構用于藥物對接篩選 , 還需要更多方面的高質量數據 。 因為人工智能下一個必須要回答的問題就是預測候選藥物與蛋白質的結合強度 。 這取決于結合時的鹽濃度和pH、藥物溶解度以及生物效價等數據 , 而這些數據目前還沒有 , 或者說有 , 但機器還沒辦法識別和利用 。
不過DeepMind的研究科學家表示:“這些數據只是尚未收集 。 現在我們已經清楚地證明了人工智能在其中的價值 , 這可能會鼓勵實驗人員從一開始就帶著機器學習的思維去進行數據集采集 。 ”
助力新藥開發 , AlphaFold并非以“速度”取勝
盡管AlphaFold在新藥開發“提速”方面的作用有限 , 它在解決蛋白折疊問題上的成就毋庸置疑依然是一項巨大突破 , 并給生物醫藥公司的研究人員們帶來了更多的想象空間 。
由于DeepMind公開了AlphaFold的代碼 , 外部的研究人員也能夠按自己的想法對AlphaFold進行研究和迭代 , 并且外部研究員對這款AI工具的研究結果和“標簽外”用途方面的創造力令創造它的內部人員都咋舌 。
哈佛大學的一項研究表明 , AlphaFold似乎已經“理解“了蛋白質的序列和結構之間關系的一些知識——即使不給它提供一些額外的、從前被認為非常重要的信息(來自相關蛋白質序列的多序列比對協同進化數據) , 它仍然可以預測出高度準確的蛋白質結構 。
為了解決AlphaFold無法顯示蛋白質在細胞中活動時構象的局限性 , DeepMind也做出了不少努力 。 2021年 , DeepMind發布了一個名為AlphaFold-Multimer的更新 , 可以對多種蛋白質的復合物進行建模 。 DeepMind的團隊用它來識別公開蛋白數據庫中的上千種復合體 , 發現它能夠預測大約70%的已知蛋白間相互作用 。
這些工具已經在幫助研究人員發現新的結合蛋白 。 斯德哥爾摩大學ArneElofsson博士的團隊在2022年NatureCommunications上發表的論文中 , 利用AlphaFold與實驗數據相結合 , 他們預測了65000種可能相互作用的蛋白對(proteinpairs)的結構 。
預測出地球上幾乎所有蛋白質結構,AI工具真能加速新藥開發嗎?
文章圖片
對于AlphaFold的另一個局限性——還需要更多方面的高質量的數據對其做出進一步的完善 , 一些科學家也作出了一些初步的探索 。 研究人員發現 , 利用AlphaFold預測蛋白質結構和結合位點解剖結構 , 進行高通量對接以進行藥物發現時 , 氨基酸和單個肽的位置需要非常精確 , 并使用其他計算方法進行優化(可能需要大量計算) , 以及把溶媒也納入考量因素 , 可以模擬準確的相關位點結合環境 , 幫助提高藥物設計的效率 。