隨著人工智能的藥學院戚逸飛快速發(fā)展,深度神經網絡能夠從蛋白質結構或序列數(shù)據中學習高階特征,王任深入掌握蛋白質序列與結構的小團習蛋關系,從而實現(xiàn)功能蛋白的隊開度學高效設計。然而,發(fā)深大多數(shù)深度學習模型仍主要用于單鏈骨架的藥學院戚逸飛設計,難以充分應對更復雜的王任蛋白-蛋白相互作用(protein-protein interaction, PPI)設計挑戰(zhàn)。為此,小團習蛋復旦大學藥學院戚逸飛/王任小團隊開發(fā)了專門用于PPI界面序列設計的隊開度學模型——ProBID-Net。該模型能夠根據給定的發(fā)深受體蛋白結構,預測配體蛋白界面上的藥學院戚逸飛氨基酸序列,并在多項測試中展現(xiàn)了優(yōu)良的王任性能。近日,小團習蛋該項研究成果在線發(fā)表于Chemical Science期刊。隊開度學
ProBID-Net首先提取目標殘基及其周圍相鄰鏈殘基主鏈原子在三維網格中的發(fā)深密度分布,隨后利用20種天然氨基酸的原子密度信息編碼,作為界面相互作用特征的輸入,最終輸出各位置氨基酸的概率,從而實現(xiàn)界面序列的精確設計。
界面序列平均恢復率和困惑度用于評估序列設計模型對PPI界面氨基酸殘基的識別和設計能力。測試結果顯示,ProBID-Net和2024年諾貝爾化學獎得主David Baker教授研究小組開發(fā)的ProteinMPNN在三個測試集上的界面殘基恢復率相當,但ProBID-Net具有更低的困惑度,預測置信度更高。
除此之外,ProBID-Net在零樣本訓練的情況下,具備預測蛋白復合物結合親和力變化的能力,并且設計的蛋白序列在界面疏水位點的保守性更高,且更符合天然蛋白中氨基酸的分布和替換規(guī)律。經過AlphaFold2 multimer驗證,ProBID-Net設計的序列能夠良好地折疊為原復合物結構,且鏈間PAE較低,進一步表明ProBID-Net在結合界面設計方面優(yōu)于ProteinMPNN (圖1)。該模型為蛋白-蛋白相互作用的設計提供了一個有效工具。目前,ProBID-Net已開源,地址為:https://github.com/ComputArtCMCG/ProBID-NET。
ProBID-Net(上)和ProteinMPNN(下)設計序列預測結構疊合比對與AlphaFold-Multimer預測鏈間PAE熱圖
復旦大學藥學院藥物化學系2021級碩士研究生陳志航為本論文第一作者,復旦大學藥學院王任小研究員、戚逸飛副研究員為本論文的通訊作者。該研究工作得到了國家自然科學基金委、國家重點研究計劃、上海市科委的項目資助,并采用復旦大學CFFF平臺進行計算。
原文鏈接:https://pubs.rsc.org/en/Content/ArticleLanding/2024/SC/D4SC02233E
制圖:實習編輯:責任編輯:孫芯蕓