科幻作家江波曾說,對于大模點新人們總是型的學網用線性方式思考問題。比如當改良蒸汽機出現后,思考人們就會期望得到更大、可再更實用的聞科機器,但現實比小說更科幻的非線性是,技術突破常常以“非線性”方式來到人們身邊。對于大模點新 從某種角度來說,型的學網今年引爆世界的思考大語言模型就是以“非線性”方式一下子進入了人類視野,以至于今年的可再世界人工智能大會上,幾乎所有關于人工智能(AI)的聞科討論都繞不開這個選項。在昨天舉行的非線性世界人工智能大會科學前沿全體會議上,對于大模型以及有望到來的對于大模點新通用人工智能(AGI),與會專家提醒,型的學網在考慮它們對人類社會帶來的影響方面,不妨讓思維“非線性”一點。 大模型或許會改變城市格局 大模型的浪潮才剛剛開始,一個無法忽視的問題是,這是一個需要投入巨大資源、消耗巨大算力的賽道。在全球進入“雙碳”時代的背景下,模型在算力層面對能源和環境的影響尤為值得關注。 由此,2017年圖靈獎得主,美國藝術與科學院(AAAS)、國家科學院(NAS)、國家工程院(NAE)院士大衛·帕特森在會上提出一個“好問題”:如果人們制造計算機的能耗大于計算的能耗,人們還需要耗費大量資源去建造更快的計算機嗎? 要回答這個問題,當務之急是要計算出計算機在工作時需要消耗多少能量,包括計算本身消耗的能量以及配電、冷卻方面的能量消耗。不少科學家做了相關實驗,發現訓練不同深度學習語言模型的二氧化碳當量從0.012至284噸不等。比如在不做超參數調整的情況下,訓練一個基于Bert的模型的碳排放相當于一次環美飛行的碳排量。帕特森自己的研究顯示,多數公司在運行深度學習神經網絡模型時所消耗的能源和算力要多于模型訓練階段。 當大算力成為一種競爭力,按照“非線性”思考方式,帕特森提醒那些氣候涼爽的高原以及擁有豐富水利資源的區域將迎來新的發展機遇。由于計算這件事在不同區域所產生的碳足跡不同,擁有“算力友好型”稟賦的區域可以借此獲得發展機會,甚至改變現有的城市格局。 與其“卷”紅海,不如尋求新突破 模型架構好比建筑框架,從設計之初就是為了貼合應用需求。復旦大學計算機科學技術學院教授邱錫鵬認為,大模型越是發展,現在的Transformer模型架構的不適應就越發突出。比如現行架構是沒有記憶的,處理長輸入需要非常高的計算量。因此,最好的方式并非在現行架構中繼續“卷”下去,而是為大模型量體裁衣設計新的架構。 事實上,芯片架構也需要創新。當下市場主流芯片架構有英特爾公司的X86和ARM公司的ARM,前者善于處理大數據,后者處理快數據為主,兩者分別支撐起個人電腦及移動互聯網(手機)時代的主流芯片架構。 相比之下,帕特森更推崇開源架構RISC-V。正是因為開創了一種系統、定量的方法來設計和評價計算機體系結構,并對RISC微處理器行業產生了持久影響,他被授予2017年圖靈獎。據介紹,RISC-V的平均指令數只有X86和ARM的1/10,且架構可以隨意更改,可滿足從智能手表、智能汽車到5G基站、服務器的各種不同性能需求。更重要的是,RISC-V不隸屬于任何一家公司,任何企業、團隊和個人都可以免費用它來設計芯片。 此外,大模型雖然帶火了GPU(圖形處理器),但正如它的名字,GPU是為了圖像處理而發明的,而且恰巧碰上了機器學習的發展浪潮。在邱錫鵬看來,與其用線性思維去“卷”GPU,不如開發更適合人工智能的硬件,或許會有新的突破。 用電影闡述AI,更要試用AI AI能幫電影人解決什么問題?《流浪地球》系列科幻影片導演郭帆說,《流浪地球2》劇組整體有3萬人,最多一場戲時2000多人在現場,現行條件下沒有一個劇組能協調好這么多人。他期望AI能給出解決方案,比如未來只需要少量人員來現場,其他人通過AI協同,可以在不同地點共同完成一件事。 作為一個用電影闡述AI的新生代導演,郭帆用實際行動證明自己對AI有著很深的思考。他表示,未來半年內,他們將嘗試在劇本、拍攝、后期、宣傳、發行等20多個電影工業化環節上“試用AI”。 用線性思維來看,郭帆稱得上是做到了擁抱新技術的最佳電影人,但他帶給人們的驚喜不止于此。“我們還要考慮到觀影模式的變化,如果未來人們是戴著頭顯看電影的,我們能否拿出足夠優秀的作品。”他說。 好在清華大學智能產業研究院院長、中國工程院外籍院士張亞勤的回答稍稍給郭帆吃下一顆定心丸。他表示,從《阿凡達》《泰坦尼克號》的制作經驗來看,雖然計算機技術發揮了越來越大的作用,但真正拿出創意的仍然是人。因此不管電影形態如何變化,作為工具的大模型只會變得更順手,它能夠讓更多人更快地將創意變成現實。 特別聲明:本文轉載僅僅是出于傳播信息的需要,并不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站注明的“來源”,并自負版權等法律責任;作者如果不希望被轉載或者聯系轉載稿費等事宜,請與我們接洽。 |