過去數十年信息革命的文心歷史告訴我們,科技的全進成功,不在于產業規模的化開河龐大,不在于設備數量的發者赴星多寡,而在于人,文心在于人的全進想象力與創造力。
當少年在校園里開發出驚人的化開河AI應用;當上班族用AI破解了困擾行業已久的難題;當一個普通人用成為開發者的方式實現了自己的夢想,這時我們才可以毫無疑問地說,發者赴星科技成功了,文心AI成功了。全進
2023年以來,化開河中國市場迎來了“百模趕考”的發者赴星盛況。但當我們把視角放在具體的文心AI開發者身上,會察覺開發者能感受到的全進區別并不大。大部分AI大模型,化開河都無法真正成為開發者手中的能力與工具。圍繞大模型的AI開發者生態難以聚攏。模型與應用開發之間存在著較為明顯的割裂。模型層面的技術進化,與開發者的真實需求之間存在著較為顯著的代溝。
這種情況如何破局?大模型如何才能真正來到開發者手中?
在4月16日,以“創造未來”為主題的Create 2024百度AI開發者大會在深圳國際會展中心舉辦。期間,百度首席技術官王海峰以“技術筑基,星河璀璨”為主題發表演講,解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展。王海峰表示,“未來,我們將繼續投身人才培養,讓人才的點點星光,匯成璀璨星河。智能時代,人人都是開發者,人人都是創造者,讓我們一起,創造美好未來”。
與絕大多數大模型項目,強調參數、精度等指標不同。文心大模型選擇了另外一條路:深入開發者的需求與夢想,開發者需要什么,文心就做什么。
沿著這樣的軌跡,文心一路進化,展現出了巨大的技術爆發力。這既奠定了文心大模型的規模化效應,也筑牢了它的長期發展方向。
文心的未來非常明確:把開發者的夢想聯接在一起,就能組成AI大模型的璀璨星河。
何處是星河?開發者的夢想就是星河
在今天我們已經可以明確地說,文心大模型是中國,乃至全球,技術進步最快,體系化升級最頻繁的大模型之一。自去年3月16日發布知識增強大語言模型文心一言以來,百度不斷推動文心大模型的升級迭代。
并且每一次版本升級都展現出核心技術的進化。文心速度,已經成為AI行業的獨特風景。
比如說,在文心大模型3.0版本當中,全面加入了知識增強、檢索增強和對話增強技術;文心3.5版本則帶來了基礎模型的全面升級,加入了精調技術創新、知識點增強、邏輯推理增強等能力;文心4.0則實現了萬卡算力的大規模并行訓練,通過與飛槳平臺聯合調優,帶來了多維數據、多階段對齊、可再生訓練等技術能力。
在大幅度、高效率的升級過程中,文心大模型能力愈發強大,效果和性能全面提升。這時很多朋友會好奇,文心究竟如何挖掘這么多的技術升級方向?為什么要保持如此高強度的升級態勢?
在Create 2024,我們就可以找到答案。
在開發者的視角看來,AI大模型正在帶來跨世代的開發奇點。原本的應用開發邊界一下被打破。AI帶來了數量龐大的新應用種類,帶來了全面降低的開發門檻,以及前所未見的開發效率。但想要真正實現AI應用開發的夢想,還需要新的技術基礎作為錨點。將AI大模型真正變為開發者手中的能力,在今天還要解決三大難題:
1.如何將AI大模型作為基礎,打破過往開發邊界,將那些前所未有的開發創意變為可能?如何實現更加智能化、前沿化的AI開發?
2.如何進一步降低開發門檻,實現低代碼,甚至無代碼的開發范式,從而實現人人都是AI開發者的時代愿景?
3.如何降低開發成本,提升開發效率,進一步完善基于AI大模型的應用開發機制,讓AI應用開發更加具備可操作性與可實現性?
打破邊界、降低門檻、優化機制,是當前開發者對AI大模型最迫切的三個愿望。而在文心大模型的最新升級中,也恰好回應了開發者的需求。
王海峰說,“希望讓人才的點點星光,匯成璀璨星河”。
對于文心大模型來說,只有回應開發者的需求,了解開發者的愿望,才能點亮這些星光。
對于文心大模型來說,AI開發者的夢想,就是以每個腳印所要奔赴的星河。
智能體,開發邊界的跨越
首先讓我們來看,文心大模型是如何打破開發邊界,帶給開發者最前沿的技術可能性。
在今天,全球AI行業最為熱議的技術方向,就是智能體。具備思考、分析、推理等多元能力為一身的智能體機制,被廣泛看好為AI技術的未來發展方向,同時也是大模型落地為AI原生應用的重要支點。
在去年10月,百度就在文心大模型中引入了智能體機制,王海峰分享了對于快思考與慢思考的理解。而在剛剛的Create 2024百度AI開發者大會中,文心大模型的技術架構中正式增加了智能體。王海峰表示,“智能體是重要的發展方向,會帶來更多的應用爆發。智能體是在基礎模型上,進一步進行思考增強訓練,包括思考過程的有監督精調、行為決策的偏好學習、結果反思的增強學習,進而得到思考模型。智能體的思考模型像人一樣,會閱讀說明書,學習工具的使用方法,進而可以調用工具來完成任務”。
在現場,王海峰演示了文心大模型4.0工具版上,如何調用工具。向文心一言提問,“我要到大灣區出差一周,想了解一下天氣變化,好決定帶什么衣服。請幫我查一下未來一周北京和深圳的溫度,告訴我出差應該帶什么衣服,并整理成表格”。
面對這一系列復雜的提問,以及相當專業的信息整理、表格生成需求,文心一言中的智能體機制,可以像人一樣進行思考、規劃,從而將需求拆解成多個子任務,首先調用“高級聯網”工具來查詢天氣信息,然后調用“代碼解釋器”畫溫度趨勢圖,進而根據未來一周的天氣情況,選擇了合適的衣物,最后對結果進行思考、確認,并自動匯總成一個表格。
這樣的技術能力,已經遠遠打破了以往AI技術,乃至大模型技術的能力邊界。開發者可以通過新的技術底座,探索更多樣,更廣袤的智能化未來。
打破邊界,是文心4.0帶給開發者第一份禮物。
智能代碼,開發范式的革新
我們都知道,傳統的應用開發范式,是基于不同編程語言的代碼書寫來實現的。而AI大模型帶給開發范式的最大變革,在于大模型本身能夠輔助生成代碼,甚至完成無代碼情況下的應用生成。
面向AI開發者與潛在AI開發者對于低門檻開發的廣泛需求,百度基于文心大模型的自然語言的能力和代碼能力,開發了代碼智能體和智能代碼助手。
其中,代碼智能體可以實現無代碼的應用開發,讓人人都可以成為AI開發者。
代碼智能體,在技術上是基于思考模型與代碼解釋器來實現。首先,思考模型會理解用戶需求,經過思考,把完成任務的指令和相關信息整合成提示,輸入給代碼解釋器。隨后,代碼解釋器根據提示,把自然語言表達的用戶需求翻譯成代碼并執行,得到執行結果或者調試信息。接著,思考模型對代碼解釋器的執行結果進行反思確認,如果正確,就把結果返回給用戶,不正確就繼續進行自主迭代更新。通過這樣的邏輯機制,智能體可以充分理解用戶的代碼生成需求,并且為結果的正確負責,實現“只要說說話,就能完成AI應用開發”。
智能代碼助手,則可以幫助專業程序員更高效地、更便捷寫出高質量代碼。在模型效果不斷提升的基礎上,百度進一步構建了智能代碼助手上下文增強、私域知識增強、流程無縫集成等能力。
目前,智能代碼助手Comate整體采納率已經達到了46%,新增代碼中生成的比例已經達到了27%。而Comate能力則可以把代碼理解、生成、優化等能力無縫集成到研發流程的各個環節,幫助提升代碼開發質量和效率。通過簡單的指令,就可以快速了解整個代碼的架構,甚至是每一個模塊的具體實現邏輯,還可以根據當前的項目代碼以及第三方代碼自動生成滿足要求的新代碼,從而讓開發人員的工作更加輕松,獲得的支持與幫助更加立體。
代碼輔助與無代碼生成,是AI時代開發范式革新的根基。百度持續在這兩方面發力,帶給了AI開發者第二份重要的禮物——超低門檻的開發機遇。
多模型,開發機制的優化
除了智能體、代碼能力之外,百度還著重推出了多模型技術。在開發者實際進行AI應用開發的過程中,對AI模型的調用和選擇是非常復雜的,往往會出現需要根據不同場景進行多模型搭配,根據軟硬件環境進行模型切換的問題。然而往往也就在多模型選擇過程中,會出現各種各樣的兼容難點以及不得已的取舍。
為了實現大模型應用在效果、效率與成本間的平衡,百度推出了多模型技術。
首先,是全面支持高效低成本的模型生產。為了實現高效低成本模型生產,百度研制了大小模型協同的訓練機制,可以有效進行知識繼承,高效生產高質量小模型,也可以利用小模型實現對比增強,幫助大模型的訓練。
同時,百度建設了種子模型矩陣,數據提質與增強機制,以及從預訓練、精調對齊、模型壓縮到推理部署的配套工具鏈。高效低成本模型生產機制,可以助力應用開發的速度更快、成本更低、效果更好。
在多模型推理方面,百度研制了基于反饋學習的端到端多模型推理技術,構建了智能路由模型,進行端到端反饋學習,充分發揮不同模型處理不同任務的能力,達到效果、效率和成本的平衡。
面向未來,多模型成為AI大模型落地的主要趨勢,而百度又一次領先一步,將其作為帶給開發者的第三個禮物。
一路前進,終到星河
洞察開發者的需求,助力開發的夢想。這個簡單的邏輯構筑了文心大模型前進的坐標,使其可以持續奔跑,一往無前。
除了智能體、代碼和多模型技術,文心大模型還在諸多方面進行了持續創新,包括基于模型反饋閉環的數據體系、基于自反饋增強的大模型對齊技術,以及多模態技術等。總體而言,文心大模型4.0的效果持續提升,發布后的半年時間,提升了52.5%的整體效果。
而文心大模型的持續快速進化,得益于百度在芯片、框架、模型和應用上的全棧布局,尤其是飛槳深度學習平臺和文心的聯合優化。文心大模型的周均訓練有效率達到98.8%,相比一年前文心一言發布時,訓練效率提升到當時的5.1倍,推理105倍。
在持續的技術創新中,文心大模型成為AI開發者的首選。截至目前,飛槳文心生態已凝聚1295萬開發者,服務24.4萬家企事業單位,基于飛槳和文心創建了89.5萬個模型。文心一言累計用戶規模已達2億,日均調用量也達到了2億,滿足了千行百業的智能化需求。
在關鍵的人才培養環節中,百度在2020年提出了5年為全社會培養500萬AI人才的目標已經提前完成。文心加飛槳,已經成為AI開發者開啟夢想之旅的不二選擇。
以開發者的真實需求為導航,以開發者的普遍期待為路標,以開發者的偉大夢想為未來。
文心就是如此一路前進,一路保持了高速迭代與全面進化。
文心會持續向前,在無數AI開發者實現夢想的那一天,在中國科技全面喚醒新質生產力的那一天,在AGI曙光到來的那一天,我們星河相見。
審核編輯 黃宇