過去數(shù)十年信息革命的文心歷史告訴我們,科技的全進(jìn)成功,不在于產(chǎn)業(yè)規(guī)模的化開河龐大,不在于設(shè)備數(shù)量的發(fā)者赴星多寡,而在于人,文心在于人的全進(jìn)想象力與創(chuàng)造力。
當(dāng)少年在校園里開發(fā)出驚人的化開河AI應(yīng)用;當(dāng)上班族用AI破解了困擾行業(yè)已久的難題;當(dāng)一個(gè)普通人用成為開發(fā)者的方式實(shí)現(xiàn)了自己的夢(mèng)想,這時(shí)我們才可以毫無疑問地說,發(fā)者赴星科技成功了,文心AI成功了。全進(jìn)
2023年以來,化開河中國(guó)市場(chǎng)迎來了“百模趕考”的發(fā)者赴星盛況。但當(dāng)我們把視角放在具體的文心AI開發(fā)者身上,會(huì)察覺開發(fā)者能感受到的全進(jìn)區(qū)別并不大。大部分AI大模型,化開河都無法真正成為開發(fā)者手中的能力與工具。圍繞大模型的AI開發(fā)者生態(tài)難以聚攏。模型與應(yīng)用開發(fā)之間存在著較為明顯的割裂。模型層面的技術(shù)進(jìn)化,與開發(fā)者的真實(shí)需求之間存在著較為顯著的代溝。
這種情況如何破局?大模型如何才能真正來到開發(fā)者手中?
在4月16日,以“創(chuàng)造未來”為主題的Create 2024百度AI開發(fā)者大會(huì)在深圳國(guó)際會(huì)展中心舉辦。期間,百度首席技術(shù)官王海峰以“技術(shù)筑基,星河璀璨”為主題發(fā)表演講,解讀了智能體、代碼、多模型等多項(xiàng)文心大模型的關(guān)鍵技術(shù)和最新進(jìn)展。王海峰表示,“未來,我們將繼續(xù)投身人才培養(yǎng),讓人才的點(diǎn)點(diǎn)星光,匯成璀璨星河。智能時(shí)代,人人都是開發(fā)者,人人都是創(chuàng)造者,讓我們一起,創(chuàng)造美好未來”。
與絕大多數(shù)大模型項(xiàng)目,強(qiáng)調(diào)參數(shù)、精度等指標(biāo)不同。文心大模型選擇了另外一條路:深入開發(fā)者的需求與夢(mèng)想,開發(fā)者需要什么,文心就做什么。
沿著這樣的軌跡,文心一路進(jìn)化,展現(xiàn)出了巨大的技術(shù)爆發(fā)力。這既奠定了文心大模型的規(guī)模化效應(yīng),也筑牢了它的長(zhǎng)期發(fā)展方向。
文心的未來非常明確:把開發(fā)者的夢(mèng)想聯(lián)接在一起,就能組成AI大模型的璀璨星河。
何處是星河?開發(fā)者的夢(mèng)想就是星河
在今天我們已經(jīng)可以明確地說,文心大模型是中國(guó),乃至全球,技術(shù)進(jìn)步最快,體系化升級(jí)最頻繁的大模型之一。自去年3月16日發(fā)布知識(shí)增強(qiáng)大語言模型文心一言以來,百度不斷推動(dòng)文心大模型的升級(jí)迭代。
并且每一次版本升級(jí)都展現(xiàn)出核心技術(shù)的進(jìn)化。文心速度,已經(jīng)成為AI行業(yè)的獨(dú)特風(fēng)景。
比如說,在文心大模型3.0版本當(dāng)中,全面加入了知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)技術(shù);文心3.5版本則帶來了基礎(chǔ)模型的全面升級(jí),加入了精調(diào)技術(shù)創(chuàng)新、知識(shí)點(diǎn)增強(qiáng)、邏輯推理增強(qiáng)等能力;文心4.0則實(shí)現(xiàn)了萬卡算力的大規(guī)模并行訓(xùn)練,通過與飛槳平臺(tái)聯(lián)合調(diào)優(yōu),帶來了多維數(shù)據(jù)、多階段對(duì)齊、可再生訓(xùn)練等技術(shù)能力。
在大幅度、高效率的升級(jí)過程中,文心大模型能力愈發(fā)強(qiáng)大,效果和性能全面提升。這時(shí)很多朋友會(huì)好奇,文心究竟如何挖掘這么多的技術(shù)升級(jí)方向?為什么要保持如此高強(qiáng)度的升級(jí)態(tài)勢(shì)?
在Create 2024,我們就可以找到答案。
在開發(fā)者的視角看來,AI大模型正在帶來跨世代的開發(fā)奇點(diǎn)。原本的應(yīng)用開發(fā)邊界一下被打破。AI帶來了數(shù)量龐大的新應(yīng)用種類,帶來了全面降低的開發(fā)門檻,以及前所未見的開發(fā)效率。但想要真正實(shí)現(xiàn)AI應(yīng)用開發(fā)的夢(mèng)想,還需要新的技術(shù)基礎(chǔ)作為錨點(diǎn)。將AI大模型真正變?yōu)殚_發(fā)者手中的能力,在今天還要解決三大難題:
1.如何將AI大模型作為基礎(chǔ),打破過往開發(fā)邊界,將那些前所未有的開發(fā)創(chuàng)意變?yōu)榭赡埽咳绾螌?shí)現(xiàn)更加智能化、前沿化的AI開發(fā)?
2.如何進(jìn)一步降低開發(fā)門檻,實(shí)現(xiàn)低代碼,甚至無代碼的開發(fā)范式,從而實(shí)現(xiàn)人人都是AI開發(fā)者的時(shí)代愿景?
3.如何降低開發(fā)成本,提升開發(fā)效率,進(jìn)一步完善基于AI大模型的應(yīng)用開發(fā)機(jī)制,讓AI應(yīng)用開發(fā)更加具備可操作性與可實(shí)現(xiàn)性?
打破邊界、降低門檻、優(yōu)化機(jī)制,是當(dāng)前開發(fā)者對(duì)AI大模型最迫切的三個(gè)愿望。而在文心大模型的最新升級(jí)中,也恰好回應(yīng)了開發(fā)者的需求。
王海峰說,“希望讓人才的點(diǎn)點(diǎn)星光,匯成璀璨星河”。
對(duì)于文心大模型來說,只有回應(yīng)開發(fā)者的需求,了解開發(fā)者的愿望,才能點(diǎn)亮這些星光。
對(duì)于文心大模型來說,AI開發(fā)者的夢(mèng)想,就是以每個(gè)腳印所要奔赴的星河。
智能體,開發(fā)邊界的跨越
首先讓我們來看,文心大模型是如何打破開發(fā)邊界,帶給開發(fā)者最前沿的技術(shù)可能性。
在今天,全球AI行業(yè)最為熱議的技術(shù)方向,就是智能體。具備思考、分析、推理等多元能力為一身的智能體機(jī)制,被廣泛看好為AI技術(shù)的未來發(fā)展方向,同時(shí)也是大模型落地為AI原生應(yīng)用的重要支點(diǎn)。
在去年10月,百度就在文心大模型中引入了智能體機(jī)制,王海峰分享了對(duì)于快思考與慢思考的理解。而在剛剛的Create 2024百度AI開發(fā)者大會(huì)中,文心大模型的技術(shù)架構(gòu)中正式增加了智能體。王海峰表示,“智能體是重要的發(fā)展方向,會(huì)帶來更多的應(yīng)用爆發(fā)。智能體是在基礎(chǔ)模型上,進(jìn)一步進(jìn)行思考增強(qiáng)訓(xùn)練,包括思考過程的有監(jiān)督精調(diào)、行為決策的偏好學(xué)習(xí)、結(jié)果反思的增強(qiáng)學(xué)習(xí),進(jìn)而得到思考模型。智能體的思考模型像人一樣,會(huì)閱讀說明書,學(xué)習(xí)工具的使用方法,進(jìn)而可以調(diào)用工具來完成任務(wù)”。
在現(xiàn)場(chǎng),王海峰演示了文心大模型4.0工具版上,如何調(diào)用工具。向文心一言提問,“我要到大灣區(qū)出差一周,想了解一下天氣變化,好決定帶什么衣服。請(qǐng)幫我查一下未來一周北京和深圳的溫度,告訴我出差應(yīng)該帶什么衣服,并整理成表格”。
面對(duì)這一系列復(fù)雜的提問,以及相當(dāng)專業(yè)的信息整理、表格生成需求,文心一言中的智能體機(jī)制,可以像人一樣進(jìn)行思考、規(guī)劃,從而將需求拆解成多個(gè)子任務(wù),首先調(diào)用“高級(jí)聯(lián)網(wǎng)”工具來查詢天氣信息,然后調(diào)用“代碼解釋器”畫溫度趨勢(shì)圖,進(jìn)而根據(jù)未來一周的天氣情況,選擇了合適的衣物,最后對(duì)結(jié)果進(jìn)行思考、確認(rèn),并自動(dòng)匯總成一個(gè)表格。
這樣的技術(shù)能力,已經(jīng)遠(yuǎn)遠(yuǎn)打破了以往AI技術(shù),乃至大模型技術(shù)的能力邊界。開發(fā)者可以通過新的技術(shù)底座,探索更多樣,更廣袤的智能化未來。
打破邊界,是文心4.0帶給開發(fā)者第一份禮物。
智能代碼,開發(fā)范式的革新
我們都知道,傳統(tǒng)的應(yīng)用開發(fā)范式,是基于不同編程語言的代碼書寫來實(shí)現(xiàn)的。而AI大模型帶給開發(fā)范式的最大變革,在于大模型本身能夠輔助生成代碼,甚至完成無代碼情況下的應(yīng)用生成。
面向AI開發(fā)者與潛在AI開發(fā)者對(duì)于低門檻開發(fā)的廣泛需求,百度基于文心大模型的自然語言的能力和代碼能力,開發(fā)了代碼智能體和智能代碼助手。
其中,代碼智能體可以實(shí)現(xiàn)無代碼的應(yīng)用開發(fā),讓人人都可以成為AI開發(fā)者。
代碼智能體,在技術(shù)上是基于思考模型與代碼解釋器來實(shí)現(xiàn)。首先,思考模型會(huì)理解用戶需求,經(jīng)過思考,把完成任務(wù)的指令和相關(guān)信息整合成提示,輸入給代碼解釋器。隨后,代碼解釋器根據(jù)提示,把自然語言表達(dá)的用戶需求翻譯成代碼并執(zhí)行,得到執(zhí)行結(jié)果或者調(diào)試信息。接著,思考模型對(duì)代碼解釋器的執(zhí)行結(jié)果進(jìn)行反思確認(rèn),如果正確,就把結(jié)果返回給用戶,不正確就繼續(xù)進(jìn)行自主迭代更新。通過這樣的邏輯機(jī)制,智能體可以充分理解用戶的代碼生成需求,并且為結(jié)果的正確負(fù)責(zé),實(shí)現(xiàn)“只要說說話,就能完成AI應(yīng)用開發(fā)”。
智能代碼助手,則可以幫助專業(yè)程序員更高效地、更便捷寫出高質(zhì)量代碼。在模型效果不斷提升的基礎(chǔ)上,百度進(jìn)一步構(gòu)建了智能代碼助手上下文增強(qiáng)、私域知識(shí)增強(qiáng)、流程無縫集成等能力。
目前,智能代碼助手Comate整體采納率已經(jīng)達(dá)到了46%,新增代碼中生成的比例已經(jīng)達(dá)到了27%。而Comate能力則可以把代碼理解、生成、優(yōu)化等能力無縫集成到研發(fā)流程的各個(gè)環(huán)節(jié),幫助提升代碼開發(fā)質(zhì)量和效率。通過簡(jiǎn)單的指令,就可以快速了解整個(gè)代碼的架構(gòu),甚至是每一個(gè)模塊的具體實(shí)現(xiàn)邏輯,還可以根據(jù)當(dāng)前的項(xiàng)目代碼以及第三方代碼自動(dòng)生成滿足要求的新代碼,從而讓開發(fā)人員的工作更加輕松,獲得的支持與幫助更加立體。
代碼輔助與無代碼生成,是AI時(shí)代開發(fā)范式革新的根基。百度持續(xù)在這兩方面發(fā)力,帶給了AI開發(fā)者第二份重要的禮物——超低門檻的開發(fā)機(jī)遇。
多模型,開發(fā)機(jī)制的優(yōu)化
除了智能體、代碼能力之外,百度還著重推出了多模型技術(shù)。在開發(fā)者實(shí)際進(jìn)行AI應(yīng)用開發(fā)的過程中,對(duì)AI模型的調(diào)用和選擇是非常復(fù)雜的,往往會(huì)出現(xiàn)需要根據(jù)不同場(chǎng)景進(jìn)行多模型搭配,根據(jù)軟硬件環(huán)境進(jìn)行模型切換的問題。然而往往也就在多模型選擇過程中,會(huì)出現(xiàn)各種各樣的兼容難點(diǎn)以及不得已的取舍。
為了實(shí)現(xiàn)大模型應(yīng)用在效果、效率與成本間的平衡,百度推出了多模型技術(shù)。
首先,是全面支持高效低成本的模型生產(chǎn)。為了實(shí)現(xiàn)高效低成本模型生產(chǎn),百度研制了大小模型協(xié)同的訓(xùn)練機(jī)制,可以有效進(jìn)行知識(shí)繼承,高效生產(chǎn)高質(zhì)量小模型,也可以利用小模型實(shí)現(xiàn)對(duì)比增強(qiáng),幫助大模型的訓(xùn)練。
同時(shí),百度建設(shè)了種子模型矩陣,數(shù)據(jù)提質(zhì)與增強(qiáng)機(jī)制,以及從預(yù)訓(xùn)練、精調(diào)對(duì)齊、模型壓縮到推理部署的配套工具鏈。高效低成本模型生產(chǎn)機(jī)制,可以助力應(yīng)用開發(fā)的速度更快、成本更低、效果更好。
在多模型推理方面,百度研制了基于反饋學(xué)習(xí)的端到端多模型推理技術(shù),構(gòu)建了智能路由模型,進(jìn)行端到端反饋學(xué)習(xí),充分發(fā)揮不同模型處理不同任務(wù)的能力,達(dá)到效果、效率和成本的平衡。
面向未來,多模型成為AI大模型落地的主要趨勢(shì),而百度又一次領(lǐng)先一步,將其作為帶給開發(fā)者的第三個(gè)禮物。
一路前進(jìn),終到星河
洞察開發(fā)者的需求,助力開發(fā)的夢(mèng)想。這個(gè)簡(jiǎn)單的邏輯構(gòu)筑了文心大模型前進(jìn)的坐標(biāo),使其可以持續(xù)奔跑,一往無前。
除了智能體、代碼和多模型技術(shù),文心大模型還在諸多方面進(jìn)行了持續(xù)創(chuàng)新,包括基于模型反饋閉環(huán)的數(shù)據(jù)體系、基于自反饋增強(qiáng)的大模型對(duì)齊技術(shù),以及多模態(tài)技術(shù)等。總體而言,文心大模型4.0的效果持續(xù)提升,發(fā)布后的半年時(shí)間,提升了52.5%的整體效果。
而文心大模型的持續(xù)快速進(jìn)化,得益于百度在芯片、框架、模型和應(yīng)用上的全棧布局,尤其是飛槳深度學(xué)習(xí)平臺(tái)和文心的聯(lián)合優(yōu)化。文心大模型的周均訓(xùn)練有效率達(dá)到98.8%,相比一年前文心一言發(fā)布時(shí),訓(xùn)練效率提升到當(dāng)時(shí)的5.1倍,推理105倍。
在持續(xù)的技術(shù)創(chuàng)新中,文心大模型成為AI開發(fā)者的首選。截至目前,飛槳文心生態(tài)已凝聚1295萬開發(fā)者,服務(wù)24.4萬家企事業(yè)單位,基于飛槳和文心創(chuàng)建了89.5萬個(gè)模型。文心一言累計(jì)用戶規(guī)模已達(dá)2億,日均調(diào)用量也達(dá)到了2億,滿足了千行百業(yè)的智能化需求。
在關(guān)鍵的人才培養(yǎng)環(huán)節(jié)中,百度在2020年提出了5年為全社會(huì)培養(yǎng)500萬AI人才的目標(biāo)已經(jīng)提前完成。文心加飛槳,已經(jīng)成為AI開發(fā)者開啟夢(mèng)想之旅的不二選擇。
以開發(fā)者的真實(shí)需求為導(dǎo)航,以開發(fā)者的普遍期待為路標(biāo),以開發(fā)者的偉大夢(mèng)想為未來。
文心就是如此一路前進(jìn),一路保持了高速迭代與全面進(jìn)化。
文心會(huì)持續(xù)向前,在無數(shù)AI開發(fā)者實(shí)現(xiàn)夢(mèng)想的那一天,在中國(guó)科技全面喚醒新質(zhì)生產(chǎn)力的那一天,在AGI曙光到來的那一天,我們星河相見。
審核編輯 黃宇