電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的大模代國(guó)快速發(fā)展,對(duì)GPU計(jì)算能力的面臨需求也越來越高。國(guó)內(nèi)企業(yè)也正在不斷提升GPU性能,挑戰(zhàn)以滿足日益增長(zhǎng)的大模代國(guó)應(yīng)用需求。然而,面臨相較于國(guó)際巨頭,挑戰(zhàn)國(guó)內(nèi)GPU仍然存在差距,大模代國(guó)國(guó)產(chǎn)GPU在不斷成長(zhǎng)的面臨過程中也存在諸多挑戰(zhàn)。
在大模型訓(xùn)練上存在差距
大語(yǔ)言模型是挑戰(zhàn)基于深度學(xué)習(xí)的技術(shù)。這些模型通過在海量文本數(shù)據(jù)上的大模代國(guó)訓(xùn)練,學(xué)習(xí)語(yǔ)言的面臨語(yǔ)法、語(yǔ)境和語(yǔ)義等多層次的挑戰(zhàn)信息,用于理解和生成自然語(yǔ)言文本。大模代國(guó)大語(yǔ)言模型是面臨自然語(yǔ)言處理(NLP)領(lǐng)域中的一個(gè)重要分支,應(yīng)用于文本生成、挑戰(zhàn)分類、情感分析等多種任務(wù)。
深度學(xué)習(xí)是現(xiàn)代機(jī)器學(xué)習(xí)領(lǐng)域的一種強(qiáng)大的算法,它可以在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、游戲AI等各種應(yīng)用領(lǐng)域取得驚人的成果。然而,深度學(xué)習(xí)對(duì)計(jì)算幾硬件的要求非常高,通常需要使用GPU進(jìn)行大規(guī)模訓(xùn)練。在使用GPU進(jìn)行深度學(xué)習(xí)時(shí),一個(gè)常見的問題就是選擇單精度還是雙精度。
浮點(diǎn)數(shù)是一種用于表示實(shí)數(shù)的數(shù)值格式,它包括符號(hào)位、指數(shù)位和尾數(shù)位三部分。通過這三部分,浮點(diǎn)數(shù)可以表示非常大或非常小的數(shù),同時(shí)保持一定的精度。
單精度和雙精度是指浮點(diǎn)數(shù)在計(jì)算機(jī)中的存儲(chǔ)方式和精度。單精度通常使用32位(4字節(jié))來存儲(chǔ)一個(gè)浮點(diǎn)數(shù),而雙精度則使用64位(8字節(jié))來存儲(chǔ)。由于雙精度使用了更多的位數(shù),因此它可以表示更大范圍的數(shù)值,并具有更高的精度。
大模型訓(xùn)練需要處理高顆粒度的信息,因此對(duì)于用于大模型訓(xùn)練的GPU芯片處理信息的精細(xì)度和算力速度要求更高,現(xiàn)階段,國(guó)產(chǎn)GPU在支持大模型訓(xùn)練的能力方面相對(duì)來說還較差。
不同于多媒體和圖形處理的單精度浮點(diǎn)計(jì)算(FP32)計(jì)算需求,雙精度浮點(diǎn)計(jì)算能力FP64是進(jìn)行高算力計(jì)算的硬性指標(biāo)。英偉達(dá)的A100同時(shí)具備上述兩類能力,而國(guó)內(nèi)大多GPU只能處理單精度浮點(diǎn)計(jì)算。
從目前的信息來看,海光信息的協(xié)處理器(DCU)能夠支持FP64雙精度浮點(diǎn)運(yùn)算,海光DCU屬于GPGPU 的一種,采用“類CUDA”通用并行計(jì)算架構(gòu)。據(jù)該公司介紹,其DCU產(chǎn)品能夠完整支持大模型訓(xùn)練。不過相比于英偉達(dá)的A100性能只有其60%。
另外,景嘉微表示面向AI 訓(xùn)練、AI推理、科學(xué)計(jì)算等應(yīng)用領(lǐng)域研發(fā)成功的景宏系列,支持INT8、FP16、FP32、FP64等混合精度運(yùn)算,該產(chǎn)品在大模型的訓(xùn)練上或許也可以期待一下。
在軟件和生態(tài)方面存在差距
除上述情況以外,國(guó)產(chǎn)GPU在軟件和生態(tài)方面與全球領(lǐng)先品牌相比,也存在一定的差距。軟件工具鏈的完善度方面,全球領(lǐng)先的GPU廠商已經(jīng)構(gòu)建了完整的軟件工具鏈,包括編譯器、調(diào)試器、性能分析工具等,可以方便地支持開發(fā)人員進(jìn)行GPU程序的開發(fā)、調(diào)試和優(yōu)化。而國(guó)產(chǎn)GPU在這方面還需要進(jìn)一步完善,以滿足用戶的多樣化需求。
生態(tài)系統(tǒng)的成熟度方面,全球GPU市場(chǎng)已經(jīng)形成了較為成熟的生態(tài)系統(tǒng),涵蓋了各種應(yīng)用領(lǐng)域和場(chǎng)景。然而,國(guó)產(chǎn)GPU在生態(tài)系統(tǒng)建設(shè)方面尚處于起步階段,缺乏足夠的應(yīng)用支持和市場(chǎng)認(rèn)可。這導(dǎo)致國(guó)產(chǎn)GPU在市場(chǎng)上的競(jìng)爭(zhēng)力相對(duì)較弱,難以與全球領(lǐng)先品牌抗衡。
近些年可以明顯的看到,國(guó)產(chǎn)PGU企業(yè)也正在這些方面不斷努力。在軟件支持方面,國(guó)產(chǎn)GPU企業(yè)正在積極與主流操作系統(tǒng)、開發(fā)環(huán)境以及圖形處理軟件等進(jìn)行適配,確保用戶能夠流暢地使用各種應(yīng)用軟件。同時(shí),一些企業(yè)還在推動(dòng)GPU在人工智能、云計(jì)算等新興領(lǐng)域的應(yīng)用,為國(guó)產(chǎn)GPU生態(tài)注入新的活力。
在驅(qū)動(dòng)程序優(yōu)化方面,國(guó)產(chǎn)GPU企業(yè)也在加大投入力度,不斷提升驅(qū)動(dòng)程序的性能和穩(wěn)定性。通過優(yōu)化驅(qū)動(dòng)程序,可以充分發(fā)揮GPU的性能優(yōu)勢(shì),提升整體計(jì)算效率。
此外,國(guó)產(chǎn)GPU企業(yè)還在積極探索與各種應(yīng)用場(chǎng)景的深度融合。例如,在游戲、圖形設(shè)計(jì)、視頻渲染等領(lǐng)域,國(guó)產(chǎn)GPU正在與相關(guān)企業(yè)合作,共同推動(dòng)相關(guān)應(yīng)用的發(fā)展。這種深度融合不僅有助于提升國(guó)產(chǎn)GPU的市場(chǎng)競(jìng)爭(zhēng)力,也有助于推動(dòng)整個(gè)產(chǎn)業(yè)的進(jìn)步。
寫在最后
近些年國(guó)產(chǎn)GPU正在蓬勃發(fā)展,不過相較于國(guó)際巨頭,仍然存在較大差距。近年來,大模型快速發(fā)展,國(guó)產(chǎn)GPU在大模型訓(xùn)練方面的不足也凸顯出來。不過也可以看到,目前國(guó)產(chǎn)GPU企業(yè)都在積極朝大模型方向布局,包括訓(xùn)練和推理。另外軟件和生態(tài)建設(shè)也在加速推進(jìn)。