「首個 AI 程式設(shè)計師」Devin 發(fā)表後,程式程式大有取代人類程式設(shè)計師的設(shè)計師D設(shè)計師開始反意味。
Devin展示AI自動處理各種程式的大殺案例。Devin產(chǎn)生「康威生命遊戲」最讓筆者震驚。人類「生命遊戲」是程式程式由英國數(shù)學(xué)家約翰·何頓·康威(John Horton Conway)1970年創(chuàng)造的抽象模擬程式。遊戲本質(zhì)是設(shè)計師D設(shè)計師開始反展示如何從極簡單規(guī)則湧現(xiàn)複雜行為模式,是大殺計算理論、複雜系統(tǒng)和人工智慧等經(jīng)典研究模型。人類
▲ Devin 介面。程式程式
上圖右是設(shè)計師D設(shè)計師開始反Devin產(chǎn)生的目錄頁面,展示圖片,大殺甚至還有提示說你必須啟動JavaScript才能啟動程式。人類可見Devin不只有程式設(shè)計能力,程式程式還有絕對符合大廠產(chǎn)品經(jīng)理的設(shè)計師D設(shè)計師開始反設(shè)計美學(xué)。Cognition也宣稱Devin能製作網(wǎng)頁,大殺平均5分鐘就能做好。
不了解程式設(shè)計的人可能不清楚,能做出生命遊戲的人工智慧究竟有多可怕。為了顯示Devin多厲害,筆者找出Devin誕生前就很不錯的開源AI軟體Project Devika,做了類似生命遊戲(下圖上)。下圖下作者是Devin,白色小格子尺寸越小,代表程式等級越高,下圖上白色格紋解析度遠低於下圖下,表示Devin的生命遊戲比Project Devika優(yōu)秀。
▲ Project Devika生成的生命遊戲。
▲ Devin生成的生命遊戲。
事情還沒完。Devin還未公開,但拿到內(nèi)測機會的程式設(shè)計師,已提出各種刁鑽任務(wù)考驗它,但表現(xiàn)令人感到恐怖。有工程師要求Devin安裝Github的chatbot-ui,就是「LINE」,不過好友名單是各式各樣大語言模型,如ChatGPT、Llama 2。安裝人工智慧版LINE後,工程師要求Devin用軟體傳訊給GPT4。
▲ chatbot-ui。
最後結(jié)果是Devin成功了。工程師除了提供Devin帳號,沒有教Devin任何事,包括安裝環(huán)境和軟體使用方法等,是Devin接到指令後自己完成。
其實各種案例看來,Devin程式設(shè)計能力歸功於檢索能力。給Devin一段Github位址,它就能自動扒出程式碼,然後透過程式碼和提示詞產(chǎn)生符合需求的程式。人類工程師其實不會知道所有程式碼,只知道如何達成這些功能(每段程式碼那麼多字,誰能背得下來?)只要知道如何寫,就能去專門程式碼網(wǎng)站「搬運」程式碼。
現(xiàn)在,Devin也做到了。
其實工程師理解程式碼時,很大一定程度不是看程式碼本身,而是看程式碼旁邊的註釋,如註解寫這段程式碼是為了檢索、那段程式碼是為了循環(huán)。Devin只花更短時間直接跑一遍結(jié)果,當(dāng)然比人類快太多。
跟人一樣懶卻更強,讓人類工程師立刻感受到就業(yè)壓力,於是第一批「反抗」AI的勇者出現(xiàn)了。Reddit最近出現(xiàn)不少對Devin口誅筆伐、口無遮攔怒罵「Fxxk you Devin」的程式設(shè)計師,甚至名字叫Devin的人也受波及,因在他們看來,Devin讀懂程式碼、寫程式,這還可以理解,但Devin沒有人教使用方法,就直接使用其他程式,這未免太厲害了,於是開始找Devin各種疑點。
網(wǎng)友minegen88「發(fā)現(xiàn)」一個問題:既然Devin懂寫,還能自己架網(wǎng)頁,為什麼Cognition網(wǎng)頁設(shè)計如此簡陋?
(Source:Cognition)
他審視Cognition官網(wǎng)元素,發(fā)現(xiàn)需透過Clerk.com及Ashby等第三方服務(wù)處理後臺任務(wù),換句話說,有前後端開發(fā)能力的人,開發(fā)不了前後端功能,minegen88質(zhì)疑為什麼Cognition不讓Devin做個好一點的網(wǎng)頁,一方面能宣傳Devin的能力,另一方面還能加強官網(wǎng)功能,何樂而不為?
其他網(wǎng)友也坐不住,紛紛尋找Cognition作假的蛛絲馬跡。有人發(fā)現(xiàn),Cognition右上角超連結(jié)的部落格,其實只是靜態(tài)頁面,根本不是完整部落格。靜態(tài)頁面是指伺服器端固定不變的網(wǎng)頁檔案,網(wǎng)頁建立時就確定,一旦存在伺服器,就不會因不同使用者或不同時間要求而變化,每次造訪伺服器傳回使用者的網(wǎng)頁內(nèi)容都相同,但部落格平臺因更新內(nèi)容,不可能是靜態(tài)頁面。
網(wǎng)友又進一步挖掘,發(fā)現(xiàn)這頁面上傳文件時,如果沒有登入會出現(xiàn)錯誤提示,但沒有提供有用錯誤ID、時間點或其他後設(shè)資料,且前端介面沒有相應(yīng)錯誤回饋,只是加載動畫一直轉(zhuǎn)轉(zhuǎn)轉(zhuǎn)。簡單講,如果不登入就不能發(fā)表內(nèi)容,然而想登入也無法登入。
Reddit阿宅有個特點,一旦某件事有問題,就會肉搜當(dāng)事人,Cognition創(chuàng)辦人Scott Wu也逃不過。網(wǎng)友很快發(fā)現(xiàn)Scott Wu宣稱在哈佛大學(xué)學(xué)習(xí)經(jīng)濟學(xué),畢業(yè)後於財富管理軟體公司Addepar擔(dān)任軟體工程師,之後與他人共同創(chuàng)立並領(lǐng)導(dǎo)人工智慧驅(qū)動社群平臺Lunchclub,擔(dān)任CTO五年。雖然Cognition官網(wǎng)表示,團隊都是頂級工程師組成,但Reddi網(wǎng)友尤其minegen88認(rèn)為,這種履歷並不能稱為頂級。
接下來更有意思,其他網(wǎng)友發(fā)現(xiàn)Scott Wu 14年前參加電視節(jié)目的影片,Scott Wu不到1秒就能讀完並解答很難的數(shù)學(xué)題,有人說「我甚至還沒看完題目,他答案就出來了」。如此經(jīng)歷加上這段影片,網(wǎng)友都認(rèn)為Scott Wu作假機率很高。
▲ Scott Wu。(Source:Cognition)
這部分是美國國情導(dǎo)致,2000年後美國電視節(jié)目造假算常態(tài),如影片電視節(jié)目,比賽開始前就以特定題型訓(xùn)練參賽者,正式比賽時當(dāng)然都是出同類型題目,使特訓(xùn)過選手能很快答題。
有了蛛絲馬跡,網(wǎng)友又回到Devin展示影片研究。所有Devin展示影片,聊天框內(nèi)容都是提前打好的,有種可能是Cognition團隊沒有輸入任何內(nèi)容,是直接複製程式碼放在螢?zāi)挥覀?cè),再據(jù)右側(cè)程式編出來左側(cè)用戶和Devin的對話。
疑問越來越多後,Reddit聚集一群認(rèn)定Scott Wu就是作假的工程師。
▲ 各職業(yè)網(wǎng)友都在質(zhì)疑Devin。
有人把質(zhì)疑和各種「柯南」行為視為人類第一次反攻AI工程師,但結(jié)果看來有點荒謬,更像Reddit宅男的自嗨鬧劇。且人類還在找蛛絲馬跡的時候,內(nèi)測過Devin的工程師下了一個指令,請Devin去Reddit發(fā)文問建站需求。
I asked the Devin AI agent to go on reddit and start a thread where it will take website building requests
It did that, solving numerous problems along the way. It apparently decided to charge for its work. Going to take it down before it fools anyone… https://t.co/QcsXu2PRs4 pic.twitter.com/zxigtajJs7
— Ethan Mollick (@emollick) March 19, 2024
Devin不僅做到,且解決了一系列需求後,自己決定開始收費,這工程師不得不在它騙倒所有人前把它弄下線。看來,人類得想想其他「對抗」AI的辦法了。
(本文由 品玩 授權(quán)轉(zhuǎn)載;首圖來源:Pixabay)
延伸閱讀:
- AI 化身軟體工程師「Devin」,會寫程式、Debug、完成複雜開發(fā)專案