2023年,英特AI成為最熱門的爾至關鍵詞,ChatGPT風靡全球。強戰(zhàn)無論AI未來怎么發(fā)展,略背硬件和算力都一定是思量最重要的一塊。作為IT領域基礎設施提供商的英特英特爾接下來有什么計劃?將如何在這個AI時代持續(xù)展現(xiàn)自己的實力呢?
最近幾年,隨著AI產(chǎn)業(yè)的爾至快速發(fā)展,全球所需要的強戰(zhàn)算力規(guī)模越來越龐大。從數(shù)據(jù)中心到云、略背到端再到邊緣計算,思量新的英特需求不斷涌現(xiàn)。作為業(yè)界硬件產(chǎn)業(yè)的爾至引領者之一——英特爾未來的動向一直深受全球用戶和投資者關注。
就在不久前,強戰(zhàn)英特爾舉辦了一場投資者網(wǎng)絡研討會,略背英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera、思量英特爾首席技術(shù)官兼軟件與技術(shù)集團負責人Greg Lavender和英特爾公司副總裁兼至強產(chǎn)品部總經(jīng)理Lisa Spelman在研討會上聚焦英特爾的數(shù)據(jù)中心和人工智能業(yè)務部門,詳細介紹了英特爾最新的市場預測、硬件計劃以及如何通過軟件賦能開發(fā)者。
本次網(wǎng)絡研討會展示了英特爾數(shù)據(jù)中心業(yè)務的最新情況,其中包括有關未來幾代英特爾至強芯片的信息、英特爾第四代至強可擴展處理器的最新進展,以及英特爾硬件對比競品、運行繁重的AI工作負載時的演示等,為大家展現(xiàn)了英特爾接下來的計劃和一系列新進展。
英特爾第四代至強處理器深受歡迎
此前,英特爾推出了第四代至強可擴展處理器(代號為Sapphire Rapids),這是英特爾面向服務器市場推出的最新一代CPU,可提供比上一代更好的單核性能以及更高的核心數(shù)量,帶來了更高的能效比。第四代至強可擴展處理器采用英特爾目前最新的Intel7工藝,最大核心可達60核心,憑借全新的Golden Cove架構(gòu),第四代至強可擴展處理器在性能和功能上表現(xiàn)都很出色,在一定程度上減輕了英特爾面對AMD推出超多核心服務器處理器后的市場壓力。
▲第四代至強可擴展處理器可能是英特爾重新興起的一個契機
英特爾第四代至強可擴展系列處理器最引人關注的創(chuàng)新在于全面走向DSA(領域?qū)S眉軜?gòu))化,通過內(nèi)置的七大加速模塊,在面對業(yè)內(nèi)廣泛存在的專業(yè)化任務時,不再依賴于CPU核心數(shù)量的多寡,而是直接調(diào)用對應的專屬模塊進行加速,可極大地提升計算效能。根據(jù)英特爾的介紹,第四代至強可擴展處理器包含的七大加速功能主要有以下幾類:
1.英特爾AMX高級矩陣擴展:主要針對矩陣計算、AI計算進行加速的計算單元,支持中小型深度學習訓練模型,也適合自然語言處理等。英特爾數(shù)據(jù)顯示,和FP32單元相比,AMX在PyTorch的實時推理和訓練性能提升了10倍。
▲不同的加速單元帶來了針對不同應用的加速,圖為AMX單元加速矩陣計算。
2.英特爾DLB動態(tài)負載均衡器:可以每秒處理數(shù)百萬個隊列的管理操作,在不同的CPU內(nèi)核之間高效分配任務,自動實現(xiàn)動態(tài)平衡。DLB最高可以降低96%的數(shù)據(jù)延遲。
3.英特爾DSA數(shù)據(jù)流加速器:專為卸載常見的、會導致數(shù)據(jù)中心規(guī)模部署開銷的數(shù)據(jù)移動任務設計。把CPU、內(nèi)存和緩存從數(shù)據(jù)移動的繁重任務中解放出來,最高可以提高1.7倍的性能。
4.英特爾IAA存內(nèi)分析加速器,這個功能可以將任務從CPU內(nèi)核卸載,以加速數(shù)據(jù)庫查詢吞吐量和其他類型的工作負載。英特爾數(shù)據(jù)顯示,IAA在RocksDB上的性能最高提升了3倍。
5.英特爾QAT數(shù)據(jù)保護和壓縮加速技術(shù):可以用于卸載加密、解密和數(shù)據(jù)壓縮等工作,用于釋放處理器內(nèi)核并降低系統(tǒng)功耗等。英特爾QAT最高可以實現(xiàn)2倍的數(shù)據(jù)壓縮效能,并釋放CPU核心。
6.英特爾安全引擎:包括英特爾SGX軟件防護擴展、英特爾Trust Domain Extension可信領域擴展、英特爾密碼操作硬件加速、英特爾內(nèi)存故障管理技術(shù)、英特爾平臺固件彈性技術(shù)等,提高整體系統(tǒng)的安全性。
7.英特爾至強Max系列處理器:首次提供了板載的HBM內(nèi)存,最高可為內(nèi)存受限的應用帶來3.7倍性能提升。
▲全新的英特爾第四代至強可擴展處理器兼?zhèn)淦叽蠹铀偕衿?/p>
在擁有這七大加速模塊之后,全新的第四代至強可擴展處理器在實際性能方面有了極大的提升。市場表現(xiàn)方面,它也展現(xiàn)出非常不錯的效果,英特爾宣稱其迎來了450款根據(jù)新處理器設計的產(chǎn)品或者系統(tǒng),其中200多款已經(jīng)開始出貨。不僅如此,目前還有50多個主流OEM和ODM廠商均在出貨基于第四代英特爾至強可擴展處理器的系統(tǒng),而全球前十大云服務提供商也在部署基于第四代至強的服務。
▲第四代至強可擴展處理器一共迎來了450款根據(jù)新處理器設計的產(chǎn)品或者系統(tǒng),其中200多款已經(jīng)開始出貨。
英特爾預計,隨著全新第四代至強可擴展處理器在2023年的持續(xù)發(fā)展和進步,還有更多廠商基于第四代至強可擴展處理器進行產(chǎn)品研發(fā),英特爾有望在企業(yè)級和數(shù)據(jù)中心市場重獲增長。
未來:英特爾發(fā)布至強可擴展處理器新路線圖
在本次會議上,英特爾還給出了至強可擴展系列處理器的最新路線圖,以及全新的第五代至強可擴展系列處理器的一些技術(shù)特性預覽,包含了不少有意思的信息,值得一看。
英特爾認為目前企業(yè)級市場開始分化。部分應用需要更高的每核心性能優(yōu)化,也就是更強大的單核心性能有助于加速處理,但是部分應用需要更多的核心并行完成,也就是更多的核心數(shù)量有助于任務快速完成。這兩個特點,恰好對應英特爾目前所擁有的P核心(也就是性能核)以及E核心(也就是能效核)。鑒于此,英特爾計劃從下一代產(chǎn)品開始發(fā)布更有針對性的產(chǎn)品。
英特爾計劃在2023年第四季度發(fā)布第五代至強可擴展處理器,代號為Emerald Rapids,全部都采用P核心,也就是面向核心性能優(yōu)化。緊接著,在2024年上半年,英特爾將發(fā)布代號為Sierra Forest的全新一代至強可擴展處理器,這款處理器將最多每插槽擁有144個能效核心,并且將采用全新的Intel 3工藝。
▲2024年上半年,英特爾將發(fā)布代號為Sierra Forest的全新一代至強可擴展處理器,這款處理器將最多每插槽擁有144個能效核心。
值得注意的是,Sierra Forest的第一批樣品已經(jīng)交付給合作伙伴,任務管理器中已經(jīng)可以看到144個完整的CPU核心。Sierra Forest整體為云計算進行優(yōu)化,云計算的某些工作任務并不需要太強大的核心性能,更多的核心數(shù)量將極大地提升云服務的響應速度。因此Sierra Forest的出現(xiàn)將更出色的每瓦特性能、更高的內(nèi)核密度以及更高的數(shù)據(jù)吞吐量帶到云端,同時還具有更為出色的能效表現(xiàn)。
2024年晚些時候,代號為Granite Rapids的處理器將緊隨Sierra Forest之后上市,從名稱就可以看出,這款處理器也全部采用P核心。英格爾宣稱它將和Sierra Forest使用完全相同的平臺,這有助于廠商選擇和替換,并加速產(chǎn)品上市。目前英特爾已經(jīng)可以演示Granite Rapids處理器,并表示它將帶來更高的內(nèi)核密度、存儲和IO創(chuàng)新等。
尤其值得一提的是,英特爾在Granite Rapids中引入了名為多路合并陣列的DIMM,可以在DDR5內(nèi)存的基礎上實現(xiàn)每秒8800MT/s的數(shù)據(jù)傳輸速率,相當于把峰值帶寬提升了80%。
2025年,英特爾還將繼續(xù)發(fā)布代號為Clearwater Forest、依舊全部由能效核心構(gòu)成的全新處理器產(chǎn)品。這款新品將采用英特爾最先進的18A工藝制造,這也是英特爾首次進入埃米級別的工藝。如果一切順利,將實現(xiàn)英特爾4年內(nèi)推進5個制程節(jié)點,使得英特爾在制造能力方面重新奪回市場優(yōu)勢。
▲第五代至強可擴展處理器將在2023年第四季度發(fā)布
可以看出,英特爾在技術(shù)實力和底蘊方面依舊非常雄厚。毫不夸張地說,根據(jù)英特爾的規(guī)劃,如果一切順利的話,英特爾在未來五年有望重新建立在市場中的領先優(yōu)勢,并且在不斷擴大的市場需求中攻城略地,占據(jù)更多的份額,并重新建立從技術(shù)到市場的完整驅(qū)動循環(huán)。
▲英特爾發(fā)布至強可擴展處理器遠期路線圖
AI時代:英特爾將面向所有人
目前是AI的時代,英特爾認為自己的AI定義是面向所有人,而不是單獨一兩個廠家或者企業(yè)。畢竟現(xiàn)在所有的AI技術(shù),都要基于英特爾在這數(shù)十年間不斷累積的技術(shù)和生態(tài),沒有任何AI技術(shù)能脫離英特爾的相關發(fā)明創(chuàng)造而存在。作為AI行業(yè)的技術(shù)基石,英特爾計劃持續(xù)推動AI普及,并持續(xù)開放。比如英特爾為SYCL(基于C++的開放編程模型)做出很多貢獻,客戶可以利用SYCL以及包含其功能的英特爾oneAPI來橫跨多個供應商、GPU、GPU進行編程、編譯和加速。英特爾還針對PyTorch 2.0和TensorFlow2.9進行了優(yōu)化,以更好地助力AI技術(shù)發(fā)展。
▲英特爾為SYCL(基于C++的開放編程模型)做出很多貢獻。
在目前大火的生成式AI方面,英特爾也對其進行了積極的支持。比如AI企業(yè)Hugging Face近期宣布1760億參數(shù)的BLOOMZ模型將采用包含內(nèi)置英特爾AMX加速器的第四代至強可擴展系列處理器,主要任務為運行從文本到圖像的深度學習模型Stable Diffusion,同時也為AI負載進行加速。不僅如此,即使是ChatGPT,英特爾也全力配合H100 GPU為微軟的Azure云計算以及ChatGPT進行加速,為其提供算力,這也是英特爾未來尤其關注的增長點之一。
▲英特爾一直作為AI產(chǎn)業(yè)的基石而存在
長遠的打算
英特爾雖然近幾年遇到了短暫的困難,但是這家公司目前在工藝、技術(shù)架構(gòu)、未來產(chǎn)品上的規(guī)劃和路線圖都是非常明確的:從Intel 7、Intel 4、Intel 3再到Intel 18A,以及“Rapids”和“Forest”兩個不同的至強可擴展處理器系列的分化,再加上英特爾為至強處理器定制的不同加速模塊以及英特爾在AI產(chǎn)業(yè)方面的進步——這些都顯示了英特爾面臨挑戰(zhàn)時所作出的長遠打算。可以說,英特爾正在醞釀的一切都將可能帶來行業(yè)和市場的變革,至少是非常顯著的進步。當一切回歸到正確的節(jié)奏,那個神采奕奕、技術(shù)領先的英特爾終將歸來。
審核編輯 :李倩