近日,愛芯2025玄鐵RISC-V生態(tài)大會在京召開,元智全球數(shù)百家企業(yè)及機(jī)構(gòu)齊聚,亮相探討RISC-V與AI融合的玄鐵技術(shù)路徑與生態(tài)前景。
在DeepSeek等大模型推動AI向端側(cè)滲透的愛芯浪潮下,邊緣算力需求激增,元智AI芯片行業(yè)正經(jīng)歷從“云優(yōu)先”到“云邊協(xié)同”的亮相范式轉(zhuǎn)變。作為“玄鐵優(yōu)選伙伴”,玄鐵愛芯元智攜自研愛芯通元混合精度NPU亮相,愛芯展示其如何以開放生態(tài)與專用架構(gòu),元智助力大模型在邊端側(cè)高效落地。亮相
大模型“輕量化”浪潮加速邊緣智能
DeepSeek-R1熱潮所帶來的玄鐵大模型訓(xùn)練與推理成本降低,推動AI應(yīng)用加速從云端下沉至邊緣設(shè)備。愛芯IDC數(shù)據(jù)顯示,元智未來幾年邊緣側(cè)數(shù)據(jù)量將占總數(shù)據(jù)量的亮相50%,這些數(shù)據(jù)需依賴端側(cè)AI芯片進(jìn)行實(shí)時處理,進(jìn)一步推動邊緣AI芯片市場擴(kuò)張。
然而,邊緣場景的碎片化與嚴(yán)苛的功耗限制,也對傳統(tǒng)算力架構(gòu)提出了挑戰(zhàn)。GPU雖在并行計(jì)算上具備優(yōu)勢,但其高功耗與固定架構(gòu)難以適配多樣化的端側(cè)需求;而通用CPU的靈活性雖高,卻受限于算力密度。在此背景下,通過RISC-V處理器的高效調(diào)度與NPU的專用加速,實(shí)現(xiàn)算力與能效的平衡已成為共識。
為邊緣智能而來
愛芯通元NPU原生支持主流大模型
作為“玄鐵優(yōu)選伙伴”,愛芯元智現(xiàn)場展示的愛芯通元混合精度NPU,就是針對邊緣場景設(shè)計(jì)的專用AI處理器。其以算子為原子指令集,原生支持DeepSeek、Llama、Qwen等主流大模型結(jié)構(gòu),通過多線程異構(gòu)多核設(shè)計(jì)與混合精度優(yōu)化,在保證高算力密度的同時顯著降低功耗。以典型視覺任務(wù)SwinT為例,該NPU可實(shí)現(xiàn)199 FPS/W的超低能耗,能效遠(yuǎn)超傳統(tǒng)方案。
此外,NPU的靈活擴(kuò)展能力支持算力從4T至256T動態(tài)適配,覆蓋從智能攝像頭到車載計(jì)算平臺的多樣化需求。在智慧城市領(lǐng)域,其硬件壓縮單元與算法優(yōu)化技術(shù)可明顯減少帶寬占用;在智能駕駛場景中,內(nèi)置的Transformer加速模塊可大幅降低BEV(鳥瞰圖)模型推理延遲。這些特性使其成為邊緣大模型落地的關(guān)鍵技術(shù)支撐。
RISC-V與NPU的“雙輪驅(qū)動”
RISC-V的開放性為AI芯片定制化提供了底層支持。據(jù)RISC-V國際基金會數(shù)據(jù),2024年全球RISC-V芯片出貨量已超100億顆,其中30%應(yīng)用于AI加速場景。愛芯元智深度融入玄鐵生態(tài),將自研愛芯通元NPU與玄鐵RISC-V處理器結(jié)合,提供從感知、計(jì)算到數(shù)據(jù)處理的端到端解決方案。
此次大會上,基于玄鐵C920處理器的AI PC原型機(jī)成功運(yùn)行Llama、DeepSeek等模型,驗(yàn)證了“RISC-V+NPU”異構(gòu)架構(gòu)在端側(cè)大模型部署中的可行性。而愛芯通元NPU單位能耗性能領(lǐng)先行業(yè)平均水平,為邊緣設(shè)備運(yùn)行復(fù)雜AI模型樹立了新標(biāo)桿。
當(dāng)前,AI芯片行業(yè)競爭已從單純算力比拼轉(zhuǎn)向場景化適配能力。愛芯元智以“普惠AI造就美好生活”為使命,通過愛芯通元NPU與玄鐵RISC-V的深度協(xié)同,成為驅(qū)動行業(yè)從“云端集中”邁向“邊緣智能”的關(guān)鍵力量。
AI技術(shù)和應(yīng)用的持續(xù)革新,帶來邊緣AI的算力爆發(fā)。愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉表示,愛芯通元NPU與玄鐵RISC-V IP的結(jié)合,打造出高能效AI計(jì)算平臺,滿足邊端不同場景下對感知、計(jì)算和數(shù)據(jù)處理能力的需求。未來,雙方將繼續(xù)強(qiáng)強(qiáng)聯(lián)合,探索AI算力提升及行業(yè)落地,我們相信,高效AI推理芯片的應(yīng)用也將迎來更廣闊的天地。