在創新藥物研發中,一個(ge)核心問題是(shi)如何(he)快(kuai)速發現具有理想(xiang)生物學特性的新化學實體。然而,滿足Lipinski's類藥性的化學空間所包含的理論分子數可能超過1063[1],如何(he)更高效地探索(suo)這樣巨(ju)大的多樣性空間,找(zhao)到具有良好的可合成性和成藥性的新分子是(shi)擺在計算化學家和藥物化學家麵前的一道難題。針(zhen)對這一問題,Reymond團隊利用窮(qiong)舉法構建重(zhong)原(yuan)子數在13到17範(fan)圍之內的分子結構,建立了包含有166億個(ge)化合物的GDB库[2];Levré等人從市(shi)售的炔烴和疊(die)氮化物出(chu)發通過使(shi)用Click反應(ying)規則構建了Zinclick數據庫[3],該(gai)庫具有較好的可合成性但結構類型相對單一;此外,也有一些基(ji)於人工智(zhi)能(Artificial Intelligence,AI) 方法,例如Segler等人利用LSTM模型設計集中化合物庫[4],Zhavoronkov等人將基(ji)於生成對抗網絡(luo) (GANs)的AI技術應(ying)用到化學空間探索(suo)[5]。雖然方法眾多,但這些虛擬化合物庫都麵臨著多樣性、可合成性和成藥性的多方麵問題。
如果將尋找(zhao)藥物新化學實體看做數據科學中的采(cai)樣問題,那在已知藥物結構所代表的數據點附近進(jin)行采(cai)樣無(wu)疑是(shi)獲(huo)得類藥分子結構的高效策略之一。
近日,中國科學院(yuan)上海藥物研究所蔣華良、鄭明月(yue)課題組從已批準上市(shi)藥物出(chu)發,采(cai)用電子等排體和化學反應(ying)轉化規則構建了成藥性拓展空間數據庫DrugSpaceX (https://drugspacex.simm.ac.cn/)。研究結果近期在線(xian)發表於Nucleic Acids Research,題為“DrugSpaceX: a large screenable and synthetically tractable database extending drug space” [6]。中國科學院(yuan)上海藥物研究所藥物設計與發現中心 (DDDC)的蔣華良和鄭明月(yue)研究員為論文通訊作者,第一作者是(shi)博(bo)士研究生楊天標,博(bo)士後李召(zhao)軍為共同(tong)第一作者。
目前版本的DrugSpaceX包含超過1億種可用於虛擬篩選的新分子結構,且在類藥性、可合成性和三維化學多樣性空間覆蓋率方麵均具有突(tu)出(chu)的特點 (图1),為開展虛擬篩選和藥物分子設計提供了高質(zhi)量的資源。此外,DrugSpaceX還(huai)提供了幾個(ge)規模較小的子集,包括10%多樣性子集,擴展的類藥性子集,類藥性子集,先導化合物子集和片(pian)段子集等,可供用戶免費(fei)下載使(shi)用。
图1 DrugSpaceX数据库在类药性,可合成性和结构多样性上均具有突(tu)出(chu)的特点
研究團隊使(shi)用了盤狀蛋白結構域受體 1 (discoidin domain receptor 1, DDR1)進(jin)行案例研究,展示了如何(he)利用DrugSpaceX快(kuai)速篩選活性化合物 (图2)。首先,以藥物數據集為出(chu)發點進(jin)行基(ji)於結構的虛擬篩選,選擇分子對接打分前十的藥物分子。通過文獻檢索(suo)可以發現其中Imatinib,Nilotinib,Ponatinib均對DDR1有交叉活性。然後,從DrugSpaceX上檢索(suo)前十名藥物分子第一輪衍生物,再(zai)進(jin)行第二輪篩選。可以發現,在第一輪衍生物中對接打分前十的化合物主(zhu)要集中在Ponatinib周圍(如圖2A所示),其中排名第3的化合物DE209841,已被Insilico Medicine最近報道的DDR1抑製劑專利所覆蓋(NO. WO2020079652A1)。圖2B中顯示了DE209841的預測結合模式,與Zhavoronkov等人文章報道的結合模式吻合[5]。進(jin)一步解析(xi)重(zhong)構數據集並采(cai)用相同(tong)篩選流程,可以發現對接打分和配(pei)體效率更高的新結構DE50204704。如圖2C所示,該(gai)分子結構可以視作是(shi)老(lao)藥Ponatinib經過對“tail” 和“linker” 片(pian)段進(jin)行兩(liang)輪改造得到的。
图2 預測DDR1激酶抑制剂
除了幫(bang)助藥物化學家能夠進(jin)行快(kuai)速的骨(gu)架躍(yue)遷(qian)和分子設計, DrugSpacesX為我們提供了一種高效探索(suo)類藥化學空間的思路。可以發現,通過將專家知識和人工智(zhi)能相互(hu)融合,我們可以在巨(ju)大的虛擬化學空間中更容易(yi)地找(zhao)到具有理想(xiang)生物效應(ying)的目標化合物。此外,Christoph Gorgulla等人近期在Nature發表的文章中也指出(chu)超大規模虛篩可以提高真陽性率[7],DrugSpaceX也可以與VirtualFlow等虛擬篩選平台(tai)結合使(shi)用,通過擴大初(chu)始篩選規模和提高篩選庫質(zhi)量兩(liang)方麵來進(jin)一步提升效率。目前,研發團隊還(huai)在對DrugSpaceX進(jin)行擴充(chong)和完善,期待後續(xu)可以推(tui)出(chu)功(gong)能更為強大的版本。
來源鏈接:https://mp.weixin.qq.com/s/S07nO1TEc39So2vdJUBg3A
特別聲明:本文轉載僅僅是(shi)出(chu)於傳播信息的需要,並不意(yi)味著代表本網站觀點或證實其內容的真實性。