半導(dǎo)體圈有多“卷”?看看各大廠商動作頻頻的統(tǒng)層發(fā)布會和時常更新的性能跑分就知道。近日,文章半導(dǎo)體廠商又“卷入”了生成式AI,統(tǒng)層展開性能、文章上市體驗拉鋸戰(zhàn)。統(tǒng)層11月6日,文章聯(lián)發(fā)科發(fā)布天璣9300旗艦5G生成式AI移動芯片,統(tǒng)層迎頭趕上端側(cè)人工智能這波浪潮。文章為更好服務(wù)于半導(dǎo)體廠商優(yōu)化性能、統(tǒng)層降低開發(fā)者門檻的文章需求,芯片內(nèi)核供應(yīng)商也在為產(chǎn)業(yè)鏈合作方提供效率更高的統(tǒng)層開發(fā)體驗。
作為芯片IP供應(yīng)商,文章Arm正在探索在內(nèi)核IP的統(tǒng)層基礎(chǔ)上以系統(tǒng)化的方式提供解決方案,作為支持產(chǎn)業(yè)鏈的文章新途徑。TCS23就是統(tǒng)層為日趨復(fù)雜化的SoC開發(fā)提供的一站式、簡約化的解決方案。天璣9300搭載的內(nèi)核Cortex-X4和Cortex-A720,也使用了TCS23,在幫助天璣芯片實現(xiàn)AI功能同時,還實現(xiàn)峰值性能相較上一代提升40%,功耗節(jié)省33%。
為芯片開發(fā)過程“瘦身”
性能,是芯片設(shè)計廠商的生命線。為了實現(xiàn)在有限的空間內(nèi)實現(xiàn)更優(yōu)化的性能,SoC設(shè)計正逐漸復(fù)雜化。長期以來,更高性能的內(nèi)核持續(xù)受到追捧,但要將SoC整體性能發(fā)揮到最優(yōu),不僅需要先進(jìn)的內(nèi)核,還要提升內(nèi)核的能效比,實現(xiàn)多核系統(tǒng)能效最優(yōu)。
為了幫助SoC設(shè)計廠商實現(xiàn)系統(tǒng)級性能提升,Arm推出了全面計算解決方案(TCS),一方面集成Arm全新推出的IP產(chǎn)品,另一方面將涉及系統(tǒng)層面的物理IP、架構(gòu)、工具、軟件、硬件集于一體,從SoC設(shè)計廠商的視角,預(yù)先處理其應(yīng)對計算子系統(tǒng)構(gòu)建和配置過程中的諸多挑戰(zhàn):開發(fā)用于總線互聯(lián)、系統(tǒng)級緩存(SLC)和內(nèi)存管理單元(MMU)的第三方系統(tǒng)IP,以及將所有組件集成到CPU和GPU集群等各個環(huán)節(jié)中遇到的問題。
Arm稱TCS23是移動計算提供的一站式、簡約化解決方案
簡言之,就是將業(yè)務(wù)關(guān)注重點從單IP拓展到包含架構(gòu)、工具、軟件在內(nèi)的整體方案上,最終實現(xiàn)“1+1>2”的性能優(yōu)化效果。
Arm中國區(qū)業(yè)務(wù)全球副總裁鄒挺在接受《中國電子報》記者采訪時介紹了TCS作為系統(tǒng)級解決方案的優(yōu)勢:“首先,我們的合作伙伴能夠基于此選擇最合適的配置以及CPU、GPU、互連、MMU和系統(tǒng)緩存的組合,最大限度地提高目標(biāo)用例的性能。其次,該解決方案能夠幫助客戶優(yōu)化計算系統(tǒng),以針對實際工作負(fù)載提供更具意義的性能表現(xiàn)。”針對當(dāng)前終端產(chǎn)品配置人工智能功能的需求,TCS23還可幫助用戶端設(shè)備上的人工智能相機等的工作負(fù)載映射到系統(tǒng)中的不同計算組件上,以此減輕執(zhí)行機器學(xué)習(xí)模塊的工作負(fù)載。
早在2021年,Arm就已推出全面計算解決方案,在推出全新IP的基礎(chǔ)上提供一整套專為無縫協(xié)同工作而設(shè)計的IP組合,能夠大幅降低SoC設(shè)計的復(fù)雜性,減少工程成本和資源消耗,縮短上市時間。而全新的Arm全面計算解決方案(TCS23)在此基礎(chǔ)上,順應(yīng)更廣泛的移動計算趨勢,可以實現(xiàn)對更復(fù)雜的用戶體驗、新軟件功能的需求以及更高性能和效率的持續(xù)突破。
Arm TCS23發(fā)布現(xiàn)場(左一為鄒挺,右一為Arm高級副總監(jiān)兼終端事業(yè)部總經(jīng)理Chris Bergey)
至于TCS23解決方案的整體性能如何,Arm進(jìn)行了跑分測試。數(shù)據(jù)顯示,TCS23可實現(xiàn)帶寬用量減少、峰值性能提升、異構(gòu)機器學(xué)習(xí)計算效果優(yōu)化,同時還能保障用戶數(shù)據(jù)的安全性。經(jīng)過優(yōu)化,可改善實際工作負(fù)載的響應(yīng)時間并減少帶寬用量,與上一代TCS22相比,該平臺每幀流量所占用的DRAM帶寬平均減少了30%。對于某些內(nèi)容,特別是游戲,這一測試的結(jié)果更為出色。例如,在體驗AAA級游戲《堡壘之夜》時,TCS23將系統(tǒng)級DRAM帶寬降低了44%,促使GPU和DRAM平均功率消耗減小了20%。
TCS23可有效減少DRAM帶寬用量
與TCS22相比,采用TCS23平臺執(zhí)行計算和圖形性能基準(zhǔn)測試實現(xiàn)了CPU峰值性能提升27%。此外,TCS23還對軟件和硬件進(jìn)行了優(yōu)化,從而加快了機器學(xué)習(xí)工作負(fù)載運行速度。將全新CPU與TCS23平臺中經(jīng)提升的硬件和軟件相結(jié)合后,Cortex-X4的機器學(xué)習(xí)性能平均提升了12%,Cortex-A720提升了9%,Cortex-A520提升了13%。
靈活適應(yīng)客戶定制化需求
當(dāng)前,針對用戶個性化需求提供定制化產(chǎn)品,成為終端供應(yīng)商的發(fā)展共識,也帶動了相關(guān)芯片產(chǎn)品的高靈活性、可適應(yīng)定制化的需求。
配合這一發(fā)展趨勢,TCS23也為客戶提供了調(diào)整空間。合作伙伴可基于TCS23進(jìn)行不同配置,從而自行創(chuàng)建可擴(kuò)展性高的計算解決方案。據(jù)了解,全新推出的TCS23提供了三種參考配置,包括:高端、性能和效率,適用于不同設(shè)備、應(yīng)用場景和計算要求。此外,TCS具備可擴(kuò)展性,為客戶的不同應(yīng)用市場的定制設(shè)計提供了充分的靈活性。
舉例來說, TCS23高端參考配置主要面向提供超優(yōu)質(zhì)性能和計算密集型體驗,可滿足高端和旗艦智能手機及筆記本電腦的常見需求,可呈現(xiàn)更具沖擊力的視覺效果,包括提供流暢的沉浸式AAA級移動游戲體驗、圖像和視頻增強并能增強先進(jìn)AI應(yīng)用場景以及設(shè)備多任務(wù)處理。TCS23性能參考配置專為滿足多個消費電子設(shè)備細(xì)分市場的一系列計算要求而設(shè)計,包括高端數(shù)字電視和機頂盒,以及中端智能手機。TCS23效率參考配置兼具超低功耗、超低成本和高面積利用率等優(yōu)勢,主要適用于入門級數(shù)字電視和機頂盒(STB)以及可穿戴設(shè)備等更側(cè)重上述能效因素的設(shè)備。
此外,關(guān)于TCS23的靈活性,鄒挺強調(diào):“通過TCS23,Arm提供客戶一個參考配置示例,合作伙伴完全可以根據(jù)需求,自行創(chuàng)建和配置可擴(kuò)展性高的TCS計算解決方案,以精確地滿足目標(biāo)消費類細(xì)分市場的需求。TCS23合作伙伴可以根據(jù)實際需求選擇所需的IP進(jìn)行授權(quán),也可依照目標(biāo)應(yīng)用市場進(jìn)行系統(tǒng)配置。”
終端設(shè)備的產(chǎn)品替換周期以年為計,芯片設(shè)計商與手機廠商每年都需要為下一代產(chǎn)品的提升預(yù)先進(jìn)行準(zhǔn)備。其產(chǎn)品優(yōu)化方向千差萬別,需求類型各有側(cè)重,TCS23均可結(jié)合客戶需求提供定制化的解決方案。
例如,針對客戶希望最大限度提高計算和圖形性能的需求,Arm可為客戶提供多種參考設(shè)計,幫助客戶選擇最合適的CPU、GPU和系統(tǒng)IP設(shè)置。又如,客戶希望手機用戶在玩高幀率游戲時可以保持更長的續(xù)航時間。針對這一需求,TCS23可幫助客戶在CPU上對DDK(driver development kit)工作負(fù)載進(jìn)行優(yōu)化,優(yōu)化GPU以使用系統(tǒng)緩存來提高游戲性能效率。再如,針對客戶增加手機空閑模式使用天數(shù)的需求。Arm全面計算解決方案可通過各種電源管理技術(shù)優(yōu)化計算系統(tǒng),實現(xiàn)低泄漏功耗,從而減少空閑功耗模式消耗。
鄒挺表示,TCS23的功能可部署到各級移動設(shè)備上,且每種TCS23配置(優(yōu)質(zhì)、性能或效率)包含的IP都具有相同的硬件接口和軟件支持,可以更有效地協(xié)同工作。
TCS這一解決方案以系統(tǒng)層面被推出時,為行業(yè)帶來了全新的嘗試和思路。而TCS23也為未來移動計算提供了完整的平臺。
責(zé)任編輯:姬曉婷