隨著人工智能的藥學(xué)院戚逸飛快速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)能夠從蛋白質(zhì)結(jié)構(gòu)或序列數(shù)據(jù)中學(xué)習(xí)高階特征,王任深入掌握蛋白質(zhì)序列與結(jié)構(gòu)的小團習(xí)蛋關(guān)系,從而實現(xiàn)功能蛋白的隊開度學(xué)高效設(shè)計。然而,發(fā)深大多數(shù)深度學(xué)習(xí)模型仍主要用于單鏈骨架的藥學(xué)院戚逸飛設(shè)計,難以充分應(yīng)對更復(fù)雜的王任蛋白-蛋白相互作用(protein-protein interaction, PPI)設(shè)計挑戰(zhàn)。為此,小團習(xí)蛋復(fù)旦大學(xué)藥學(xué)院戚逸飛/王任小團隊開發(fā)了專門用于PPI界面序列設(shè)計的隊開度學(xué)模型——ProBID-Net。該模型能夠根據(jù)給定的發(fā)深受體蛋白結(jié)構(gòu),預(yù)測配體蛋白界面上的藥學(xué)院戚逸飛氨基酸序列,并在多項測試中展現(xiàn)了優(yōu)良的王任性能。近日,小團習(xí)蛋該項研究成果在線發(fā)表于Chemical Science期刊。隊開度學(xué)
ProBID-Net首先提取目標(biāo)殘基及其周圍相鄰鏈殘基主鏈原子在三維網(wǎng)格中的發(fā)深密度分布,隨后利用20種天然氨基酸的原子密度信息編碼,作為界面相互作用特征的輸入,最終輸出各位置氨基酸的概率,從而實現(xiàn)界面序列的精確設(shè)計。
界面序列平均恢復(fù)率和困惑度用于評估序列設(shè)計模型對PPI界面氨基酸殘基的識別和設(shè)計能力。測試結(jié)果顯示,ProBID-Net和2024年諾貝爾化學(xué)獎得主David Baker教授研究小組開發(fā)的ProteinMPNN在三個測試集上的界面殘基恢復(fù)率相當(dāng),但ProBID-Net具有更低的困惑度,預(yù)測置信度更高。
除此之外,ProBID-Net在零樣本訓(xùn)練的情況下,具備預(yù)測蛋白復(fù)合物結(jié)合親和力變化的能力,并且設(shè)計的蛋白序列在界面疏水位點的保守性更高,且更符合天然蛋白中氨基酸的分布和替換規(guī)律。經(jīng)過AlphaFold2 multimer驗證,ProBID-Net設(shè)計的序列能夠良好地折疊為原復(fù)合物結(jié)構(gòu),且鏈間PAE較低,進一步表明ProBID-Net在結(jié)合界面設(shè)計方面優(yōu)于ProteinMPNN (圖1)。該模型為蛋白-蛋白相互作用的設(shè)計提供了一個有效工具。目前,ProBID-Net已開源,地址為:https://github.com/ComputArtCMCG/ProBID-NET。
ProBID-Net(上)和ProteinMPNN(下)設(shè)計序列預(yù)測結(jié)構(gòu)疊合比對與AlphaFold-Multimer預(yù)測鏈間PAE熱圖
復(fù)旦大學(xué)藥學(xué)院藥物化學(xué)系2021級碩士研究生陳志航為本論文第一作者,復(fù)旦大學(xué)藥學(xué)院王任小研究員、戚逸飛副研究員為本論文的通訊作者。該研究工作得到了國家自然科學(xué)基金委、國家重點研究計劃、上海市科委的項目資助,并采用復(fù)旦大學(xué)CFFF平臺進行計算。
原文鏈接:https://pubs.rsc.org/en/Content/ArticleLanding/2024/SC/D4SC02233E
制圖:實習(xí)編輯:責(zé)任編輯:孫芯蕓