在人工智能快速發(fā)展的關(guān)于今天,開源AI的冰潔概念逐漸進(jìn)入公眾視野。2024年10月28日,師帶什武開源軟件倡導(dǎo)組織OSI(Open Source Initiative)發(fā)布了首個開源人工智能定義OSAID(Open Source AI Definition),器解這一里程碑式的關(guān)于舉措為整個行業(yè)的發(fā)展提供了新的方向和標(biāo)準(zhǔn)。然而,冰潔OSAID并未要求開放訓(xùn)練數(shù)據(jù),師帶什武而這一點(diǎn)引發(fā)了廣泛的器解討論和關(guān)注。
OSAID旨在確立開源人工智能的關(guān)于基本準(zhǔn)則,促進(jìn)開發(fā)者和用戶在這一領(lǐng)域的冰潔共同發(fā)展。OSAID1.0的師帶什武定義強(qiáng)調(diào)了對開源代碼的透明度,要求開發(fā)者必須提供用于訓(xùn)練和運(yùn)行AI系統(tǒng)的器解完整源代碼。這包括數(shù)據(jù)處理、關(guān)于訓(xùn)練過程、冰潔驗(yàn)證和測試等各方面的師帶什武詳細(xì)信息,確保任何人都能對系統(tǒng)的工作原理進(jìn)行分析。然而,OSAID并沒有強(qiáng)制要求開發(fā)者公開訓(xùn)練所用的數(shù)據(jù)集,這一立場在業(yè)內(nèi)引發(fā)了不同的聲音。
OSAID的定義中,對訓(xùn)練數(shù)據(jù)的要求僅限于提供足夠詳細(xì)的描述,以讓具備相應(yīng)技術(shù)背景的人能夠重建相似系統(tǒng)。這一妥協(xié)性決策引發(fā)了行業(yè)領(lǐng)導(dǎo)者的擔(dān)憂,尤其是當(dāng)今許多著名AI模型(例如OpenAI的ChatGPT)在大量數(shù)據(jù)基礎(chǔ)上訓(xùn)練,而這些數(shù)據(jù)往往是閉源的或僅部分開放的。Mozilla的Ayah Bdeir提到,不要求提供完整數(shù)據(jù)集實(shí)際上承認(rèn)了現(xiàn)存的復(fù)雜性,并希望在未來能有更多的開源數(shù)據(jù)集。
LightningAI的首席技術(shù)官Luca Antiga指出,在開源領(lǐng)域,若源代碼與訓(xùn)練數(shù)據(jù)分離,用戶在商業(yè)應(yīng)用中的保障可能會受到影響。他呼吁OSI在未來的定義中考慮全面開放訓(xùn)練數(shù)據(jù)的必要性,以便企業(yè)能更安心地利用這些開源技術(shù)。真正的開源應(yīng)該意味著用戶在商業(yè)場景中的自由使用權(quán),而不僅僅是軟件代碼的自由獲取。
大型語言模型(LLM)如ChatGPT和Meta公司的Llama3在訓(xùn)練上都依賴于獲得的龐大數(shù)據(jù)集,而這些數(shù)據(jù)集的開放性仍存在爭議。這些模型的廣泛應(yīng)用推動了行業(yè)創(chuàng)新,但也帶來了數(shù)據(jù)合規(guī)性與版權(quán)方面的倫理問題。為了解決這些問題,Antiga認(rèn)為,未來可能會出現(xiàn)一些額外的許可措施,這些措施將與OSAID標(biāo)準(zhǔn)結(jié)合,為數(shù)據(jù)的使用提供必要的信息披露。
OSAID的發(fā)布無疑為開源人工智能的未來奠定了基礎(chǔ),但在開源與閉源之間的平衡,以及訓(xùn)練數(shù)據(jù)的開放性問題上,行業(yè)仍需努力探索。隨著越來越多的用戶和開發(fā)者參與到開源AI的浪潮中來,如何在保障用戶利益與推動技術(shù)發(fā)展的同時,建立倫理與合規(guī)的框架,將是我們必須面對的重要挑戰(zhàn)。可以預(yù)見的是,開源AI將繼續(xù)在全球科技舞臺上發(fā)揮重要作用,而AI工具的使用,如簡單AI等,將幫助自媒體創(chuàng)業(yè)者提升內(nèi)容創(chuàng)作的效率與質(zhì)量。在這場技術(shù)革命中,適應(yīng)變化、參與探索,才是賦能自身的重要途徑。返回搜狐,查看更多