近年來(lái),速藥AlphaFold的物研橫空出世在結(jié)構(gòu)生物學(xué)領(lǐng)域?qū)崿F(xiàn)了一場(chǎng)變革。這種能準(zhǔn)確預(yù)測(cè)蛋白結(jié)構(gòu)的發(fā)發(fā)分抑AI系統(tǒng),已經(jīng)應(yīng)用于生命科學(xué)研究的現(xiàn)首各個(gè)場(chǎng)景。去年7月,制劑AlphaFold預(yù)測(cè)出98.5%的速藥人類蛋白結(jié)構(gòu);現(xiàn)在,AlphaFold又站上了藥物研發(fā)的物研戰(zhàn)線。其預(yù)測(cè)的發(fā)發(fā)分抑結(jié)構(gòu)可以促進(jìn)基于結(jié)構(gòu)的藥物設(shè)計(jì),特別是現(xiàn)首對(duì)于那些缺乏足夠的蛋白結(jié)構(gòu)信息的新靶點(diǎn)。
近日,制劑英矽智能公司的速藥研發(fā)團(tuán)隊(duì)就借助AlphaFold,針對(duì)一個(gè)缺乏可用蛋白結(jié)構(gòu)信息的物研新型靶點(diǎn),開(kāi)發(fā)出潛在的發(fā)發(fā)分抑全球首創(chuàng)(first-in-class)苗頭化合物。目前該論文已上傳至arXiv預(yù)印本平臺(tái)。現(xiàn)首
在這項(xiàng)工作中,制劑研發(fā)團(tuán)隊(duì)將AlphaFold應(yīng)用于英矽智能開(kāi)發(fā)的端到端AI藥物發(fā)現(xiàn)引擎中,這個(gè)引擎由生物計(jì)算平臺(tái)PandaOmics和生成化學(xué)平臺(tái)Chemistry42組成。
其中,PandaOmics以來(lái)自組學(xué)和文本數(shù)據(jù)的信息為起點(diǎn),將AI深度學(xué)習(xí)和生物信息學(xué)方法相結(jié)合,用于數(shù)據(jù)的分析、可視化和解讀,判定基因與疾病靶點(diǎn)的關(guān)聯(lián)性,從而找到有潛力的靶點(diǎn)。
不過(guò),如果這些靶點(diǎn)沒(méi)有明確的晶體結(jié)構(gòu),傳統(tǒng)方法將難以繼續(xù)開(kāi)展研究。這時(shí),AlphaFold的作用就體現(xiàn)了出來(lái):它能夠準(zhǔn)確地預(yù)測(cè)蛋白結(jié)構(gòu),這樣研究者就可以選擇最具潛力的靶點(diǎn),運(yùn)用Chemistry42 平臺(tái)設(shè)計(jì)苗頭化合物。
▲研發(fā)團(tuán)隊(duì)將 AlphaFold與英矽智能的AI藥物發(fā)現(xiàn)平臺(tái) PandaOmics 和 Chemistry42 相結(jié)合,針對(duì)肝細(xì)胞癌進(jìn)行靶點(diǎn)發(fā)現(xiàn)與苗頭化合物的設(shè)計(jì)和生成。(圖片來(lái)源:參考資料[1])
在這項(xiàng)研究中,這個(gè)引擎尋找的是針對(duì)肝細(xì)胞癌的靶點(diǎn)。根據(jù)國(guó)際癌癥研究機(jī)構(gòu) (IARC) 發(fā)布的全球癌癥(GLOBOCAN)統(tǒng)計(jì)報(bào)告2020年版,原發(fā)性肝癌是全球第六大常見(jiàn)癌種,也是癌癥死亡的第三大原因。肝細(xì)胞癌 (HCC) 是肝癌的主要類型,約占患者總?cè)藬?shù)的 75%。由于預(yù)后不佳,全球范圍內(nèi)肝癌的死亡率和發(fā)病率不相上下。
為了尋找治療靶點(diǎn),研發(fā)團(tuán)隊(duì)首先獲取了包含1133 個(gè)患者樣本和 674 個(gè)健康樣本的肝細(xì)胞癌數(shù)據(jù)集。利用這些數(shù)據(jù),PandaOmics篩選出20個(gè)有潛力的靶點(diǎn)。由于AlphaFold已經(jīng)預(yù)測(cè)出這些靶點(diǎn)的晶體結(jié)構(gòu),PandaOmics可以基于靶點(diǎn)與疾病的關(guān)聯(lián)度給出評(píng)分。這樣,作者確定了得分最高的靶點(diǎn)——細(xì)胞周期蛋白依賴性激酶20(CDK20)。
已有研究發(fā)現(xiàn),CDK20在結(jié)直腸癌、肝細(xì)胞癌、肺癌和卵巢癌等多種癌癥患者的腫瘤樣本中過(guò)度表達(dá)。這個(gè)分子通過(guò)多種方式促進(jìn)腫瘤細(xì)胞的生長(zhǎng)與增殖:它們不僅參與調(diào)節(jié)腫瘤細(xì)胞周期和致癌信號(hào)傳導(dǎo),還與某些腫瘤的免疫抑制相關(guān)。因此,盡管發(fā)現(xiàn)的時(shí)間不長(zhǎng), CDK20已經(jīng)引起了廣泛關(guān)注。CDK20 抑制劑一旦問(wèn)世,將有望成為癌癥,特別是肝細(xì)胞癌的創(chuàng)新療法。
▲英矽智能針對(duì)CDK20靶點(diǎn)的苗頭化合物生成過(guò)程(圖片來(lái)源:參考資料[1])
但遺憾的是,盡管針對(duì)CDK家族其他部分成員的藥物研發(fā)大獲成功(例如多款CDK4/6抑制劑已經(jīng)獲批上市,用于治療乳腺癌、肺癌等),但針對(duì)CDK20抑制劑的研發(fā)尚未出現(xiàn)。一個(gè)重要原因就在于,CDK20沒(méi)有可用的蛋白結(jié)構(gòu)信息。在這項(xiàng)最新研究中,基于Alphafold 預(yù)測(cè)的蛋白結(jié)構(gòu),Chemistry42成功設(shè)計(jì)、生成了潛在的CDK20 抑制劑。
▲A) CDK20的 AlphaFold 預(yù)測(cè)結(jié)構(gòu);B) CDK20 的 ATP 結(jié)合口袋(圖片來(lái)源:參考資料[1])
Chemistry42從預(yù)測(cè)的蛋白結(jié)構(gòu)中發(fā)現(xiàn),CDK20有一個(gè)較淺的ATP結(jié)合口袋。結(jié)合這個(gè)口袋的結(jié)構(gòu)特性,Chemistry42設(shè)計(jì)并生成了8918種分子結(jié)構(gòu),并且最終篩選出7個(gè)最具潛力的化合物進(jìn)行合成。
▲Chemistry42生成的7 個(gè)分子的化學(xué)結(jié)構(gòu)(圖片來(lái)源:參考資料[1])
通過(guò)進(jìn)一步的評(píng)估,研發(fā)團(tuán)隊(duì)發(fā)現(xiàn)在7個(gè)候選化合物中,化合物ISM042-2-001與CDK20結(jié)合的能力極強(qiáng)。研發(fā)團(tuán)隊(duì)隨后預(yù)測(cè)了其結(jié)合模式,基于這一模式,研發(fā)團(tuán)隊(duì)目前正在對(duì)ISM042-2-001進(jìn)行更多衍生物的設(shè)計(jì)與合成,以進(jìn)一步提高酶活性。
在這篇論文里,研發(fā)團(tuán)隊(duì)展示了將AlphaFold與AI引擎PandaOmics和Chemistry42相結(jié)合,在30天內(nèi)完成了靶點(diǎn)選擇、分子生成、化合物合成和生物學(xué)測(cè)試,最終快速發(fā)現(xiàn)有望治療肝細(xì)胞癌的苗頭化合物分子。目前,對(duì)該分子的進(jìn)一步優(yōu)化仍在進(jìn)行中。這項(xiàng)研究也是將 AlphaFold 預(yù)測(cè)的蛋白結(jié)構(gòu)用于藥物研發(fā)的一個(gè)實(shí)例,之后英矽智能也會(huì)繼續(xù)公布對(duì)其他靶點(diǎn)類型(如GPCR和E3連接酶)的進(jìn)一步研究。
參考資料:
[1] Feng Ren et al., AlphaFold Accelerates Artificial Intelligence Powered Drug Discovery: Efficient Discovery of a Novel Cyclin-dependent Kinase 20 (CDK20) Small Molecule Inhibitor. arXiv:2201.09647