預測出地球上幾乎所有蛋白質結構,AI工具真能加速新藥開發嗎?

▎藥明康德內容團隊編輯
2022年7月 , DeepMind公司與歐洲生物信息研究所(EMBL-EBI)的合作團隊公布了生物學領域的一項
重大飛躍
。 他們利用人工智能(AI)系統AlphaFold預測出超過100萬個物種的2.14億個蛋白質結構 , 幾乎涵蓋了地球上所有已知蛋白質 。 而近日 , 科技公司Meta宣布 , 其
ESMFold
成功預測了超過6億個蛋白質三維結構 , 包含大量前所未見的結構 。 兩個團隊均把包含如此巨量蛋白質結構的數據庫向全球的科研人員免費開放 , 將研究成果進行了完全的共享 。
許多科學家和生物醫藥公司的研究員興奮地表示 , 這一系列突破將加速新藥開發 , 并為基礎科學帶來全新革命 。 與此同時 , 質疑的聲音也不在少數 , 很多人認為這只是一場炒作 。 那么 , 像AlphaFold這樣的AI工具 , 對于新藥開發究竟有怎樣的意義?它真的能夠加速新藥開發嗎?
預測出地球上幾乎所有蛋白質結構,AI工具真能加速新藥開發嗎?
文章圖片
圖片來源:123RF
AlphaFold在加速藥物開發的過程中的價值和局限性
要回答這個問題 , 我們首先需要了解一下常見的藥物一般是通過何種策略開發出來的 。
蛋白質是藥物開發的熱門靶標 , 因為它能控制許多人體活動的進行 , 例如抗體攻擊病原體 , 通過各種酶執行細胞過程 , 或通過信使分子(如胰島素和生長激素)發出信號 。 許多人類嚴重疾病背后的原因是由于蛋白質的功能失調 。 如果要讓這些功能失調的蛋白質回到“正軌” , 就需要開發出能夠準確識別這些“問題蛋白”并牢牢地與之結合的藥物 , 然后發揮其治療作用 。
為了更好地設計出可以與目標蛋白結合的藥物 , 了解目標蛋白結構就顯得極為重要 。 我們得先摸清這個目標蛋白上有哪些位點有與藥物分子結合的可能 , 并設計出與這些位點能夠契合的藥物——就像為一塊邊緣不規則的拼圖設計能夠與之匹配的另一塊拼圖 。
科學家們從上百萬甚至上億種化合物中 , 通過層層篩選 , 發現能夠與疾病相關的蛋白相結合的先導化合物 , 再進行逐步優化 , 最終確定少數幾個候選藥物進入臨床試驗 。 這是個耗時耗力的過程 , 如果能夠根據目標蛋白的特征直接設計出候選藥物分子 , 這將大幅度加快新藥開發的前期步驟并降低成本 。
預測出地球上幾乎所有蛋白質結構,AI工具真能加速新藥開發嗎?
文章圖片
圖片來源:123RF
現在 , AlphaFold實現了研究人員在幾年前幾乎無法想象的蛋白結構獲取速度 。 在它出現之前 , 科學家們解析的蛋白結構只覆蓋了17%的人類蛋白序列 。 而它出現后 , 98.5%的人類蛋白的結構已被其預測出來 , 其中58%的氨基酸的結構位置為可信預測 , 36%的氨基酸的結構預測有很高的置信度 。 也就是說 , 進行藥物開發時需要完成的這張拼圖 , 其中目標蛋白那一半的繪制速度有了飛躍性的提升 , 且準確性十分有保證 。
新藥開發領域的專家表示 , 這一龐大且準確的數據庫能夠讓研究人員將更多的精力投入到確認蛋白結構的細節上面 , 這是很多靶向藥物能否成功的關鍵 。 研究人員不再需要問“蛋白結構是什么樣的?” , 而是轉而去回答“我們有的蛋白結構有多大作用?”的問題 。 此外 , 這個數據庫能夠擴展可以成藥的基因組位點范圍 , 大幅度增加了科學家們發現創新藥物過程中擁有的選項 。
除此以外 , 公開可用的AlphaFold還為以前無法接觸此類科學的研究人員提供了極大的便利 。 對于資源不足的國家的科研人員來說 , 有了計算生物學 , 不必擁有如何獲得蛋白質結構的知識和進行研究的資源 , 只需一臺電腦甚至一臺手機也能獲得所需的結果了 。