半導體圈有多“卷”?看看各大廠商動作頻頻的統層發布會和時常更新的性能跑分就知道。近日,文章半導體廠商又“卷入”了生成式AI,統層展開性能、文章上市體驗拉鋸戰。統層11月6日,文章聯發科發布天璣9300旗艦5G生成式AI移動芯片,統層迎頭趕上端側人工智能這波浪潮。文章為更好服務于半導體廠商優化性能、統層降低開發者門檻的文章需求,芯片內核供應商也在為產業鏈合作方提供效率更高的統層開發體驗。
作為芯片IP供應商,文章Arm正在探索在內核IP的統層基礎上以系統化的方式提供解決方案,作為支持產業鏈的文章新途徑。TCS23就是統層為日趨復雜化的SoC開發提供的一站式、簡約化的解決方案。天璣9300搭載的內核Cortex-X4和Cortex-A720,也使用了TCS23,在幫助天璣芯片實現AI功能同時,還實現峰值性能相較上一代提升40%,功耗節省33%。
為芯片開發過程“瘦身”
性能,是芯片設計廠商的生命線。為了實現在有限的空間內實現更優化的性能,SoC設計正逐漸復雜化。長期以來,更高性能的內核持續受到追捧,但要將SoC整體性能發揮到最優,不僅需要先進的內核,還要提升內核的能效比,實現多核系統能效最優。
為了幫助SoC設計廠商實現系統級性能提升,Arm推出了全面計算解決方案(TCS),一方面集成Arm全新推出的IP產品,另一方面將涉及系統層面的物理IP、架構、工具、軟件、硬件集于一體,從SoC設計廠商的視角,預先處理其應對計算子系統構建和配置過程中的諸多挑戰:開發用于總線互聯、系統級緩存(SLC)和內存管理單元(MMU)的第三方系統IP,以及將所有組件集成到CPU和GPU集群等各個環節中遇到的問題。
Arm稱TCS23是移動計算提供的一站式、簡約化解決方案
簡言之,就是將業務關注重點從單IP拓展到包含架構、工具、軟件在內的整體方案上,最終實現“1+1>2”的性能優化效果。
Arm中國區業務全球副總裁鄒挺在接受《中國電子報》記者采訪時介紹了TCS作為系統級解決方案的優勢:“首先,我們的合作伙伴能夠基于此選擇最合適的配置以及CPU、GPU、互連、MMU和系統緩存的組合,最大限度地提高目標用例的性能。其次,該解決方案能夠幫助客戶優化計算系統,以針對實際工作負載提供更具意義的性能表現。”針對當前終端產品配置人工智能功能的需求,TCS23還可幫助用戶端設備上的人工智能相機等的工作負載映射到系統中的不同計算組件上,以此減輕執行機器學習模塊的工作負載。
早在2021年,Arm就已推出全面計算解決方案,在推出全新IP的基礎上提供一整套專為無縫協同工作而設計的IP組合,能夠大幅降低SoC設計的復雜性,減少工程成本和資源消耗,縮短上市時間。而全新的Arm全面計算解決方案(TCS23)在此基礎上,順應更廣泛的移動計算趨勢,可以實現對更復雜的用戶體驗、新軟件功能的需求以及更高性能和效率的持續突破。
Arm TCS23發布現場(左一為鄒挺,右一為Arm高級副總監兼終端事業部總經理Chris Bergey)
至于TCS23解決方案的整體性能如何,Arm進行了跑分測試。數據顯示,TCS23可實現帶寬用量減少、峰值性能提升、異構機器學習計算效果優化,同時還能保障用戶數據的安全性。經過優化,可改善實際工作負載的響應時間并減少帶寬用量,與上一代TCS22相比,該平臺每幀流量所占用的DRAM帶寬平均減少了30%。對于某些內容,特別是游戲,這一測試的結果更為出色。例如,在體驗AAA級游戲《堡壘之夜》時,TCS23將系統級DRAM帶寬降低了44%,促使GPU和DRAM平均功率消耗減小了20%。
TCS23可有效減少DRAM帶寬用量
與TCS22相比,采用TCS23平臺執行計算和圖形性能基準測試實現了CPU峰值性能提升27%。此外,TCS23還對軟件和硬件進行了優化,從而加快了機器學習工作負載運行速度。將全新CPU與TCS23平臺中經提升的硬件和軟件相結合后,Cortex-X4的機器學習性能平均提升了12%,Cortex-A720提升了9%,Cortex-A520提升了13%。
靈活適應客戶定制化需求
當前,針對用戶個性化需求提供定制化產品,成為終端供應商的發展共識,也帶動了相關芯片產品的高靈活性、可適應定制化的需求。
配合這一發展趨勢,TCS23也為客戶提供了調整空間。合作伙伴可基于TCS23進行不同配置,從而自行創建可擴展性高的計算解決方案。據了解,全新推出的TCS23提供了三種參考配置,包括:高端、性能和效率,適用于不同設備、應用場景和計算要求。此外,TCS具備可擴展性,為客戶的不同應用市場的定制設計提供了充分的靈活性。
舉例來說, TCS23高端參考配置主要面向提供超優質性能和計算密集型體驗,可滿足高端和旗艦智能手機及筆記本電腦的常見需求,可呈現更具沖擊力的視覺效果,包括提供流暢的沉浸式AAA級移動游戲體驗、圖像和視頻增強并能增強先進AI應用場景以及設備多任務處理。TCS23性能參考配置專為滿足多個消費電子設備細分市場的一系列計算要求而設計,包括高端數字電視和機頂盒,以及中端智能手機。TCS23效率參考配置兼具超低功耗、超低成本和高面積利用率等優勢,主要適用于入門級數字電視和機頂盒(STB)以及可穿戴設備等更側重上述能效因素的設備。
此外,關于TCS23的靈活性,鄒挺強調:“通過TCS23,Arm提供客戶一個參考配置示例,合作伙伴完全可以根據需求,自行創建和配置可擴展性高的TCS計算解決方案,以精確地滿足目標消費類細分市場的需求。TCS23合作伙伴可以根據實際需求選擇所需的IP進行授權,也可依照目標應用市場進行系統配置。”
終端設備的產品替換周期以年為計,芯片設計商與手機廠商每年都需要為下一代產品的提升預先進行準備。其產品優化方向千差萬別,需求類型各有側重,TCS23均可結合客戶需求提供定制化的解決方案。
例如,針對客戶希望最大限度提高計算和圖形性能的需求,Arm可為客戶提供多種參考設計,幫助客戶選擇最合適的CPU、GPU和系統IP設置。又如,客戶希望手機用戶在玩高幀率游戲時可以保持更長的續航時間。針對這一需求,TCS23可幫助客戶在CPU上對DDK(driver development kit)工作負載進行優化,優化GPU以使用系統緩存來提高游戲性能效率。再如,針對客戶增加手機空閑模式使用天數的需求。Arm全面計算解決方案可通過各種電源管理技術優化計算系統,實現低泄漏功耗,從而減少空閑功耗模式消耗。
鄒挺表示,TCS23的功能可部署到各級移動設備上,且每種TCS23配置(優質、性能或效率)包含的IP都具有相同的硬件接口和軟件支持,可以更有效地協同工作。
TCS這一解決方案以系統層面被推出時,為行業帶來了全新的嘗試和思路。而TCS23也為未來移動計算提供了完整的平臺。
責任編輯:姬曉婷