電子發燒友網報道(文/李彎彎)根據韓媒報道,星電三星電子已經開始全面開發人工智能聊天機器人背后的自己關鍵技術——大語言模型(LLM),以供內部使用。語言月底
三星電子多名工作人員透露,模型公司已于本月初開始開發自己的完成大語言模型,由三星研究院主導,初始已經著手調動所有相關人力和資源,版本目標是星電在7月底前完成初始版本的開發。
防止技術泄露,自己三星開發自己的語言月底大語言模型
三星起初曾使用過ChatGPT等生成式AI。該公司認為,模型人工智能可以大大縮短軟件開發和半導體設計的完成周期,因此先期對引入人工智能的初始各種方式充滿興趣。
然而,版本今年3月30日,星電據韓媒報道,三星內部發生三起涉及ChatGPT誤用與濫用案例,包括兩起“設備信息泄露”和一起“會議內容泄露”。
三起泄密事件均發生在三星電子半導體暨裝置解決方案(Device Solutions,簡稱“DS”)部門。三星DS部門的A職員,在執行半導體設備測量資料庫(DB)下載程序的源代碼時出現了錯誤,便復制出有問題的原始代碼到ChatGPT,并詢問了解決方法。
三星DS部門的B職員把為了把握產量、不良設備而編寫的源代碼輸入到ChatGPT,并要求其優化。三星DS部門的C職員則將手機錄制的會議內容轉換為文件后輸入到ChatGPT,要求其制作會議紀錄。
三星電子認為,在ChatGPT輸入內容后,相關資料都將傳送到外部服務器,如果讓ChatGPT學習三星內部資料,可能會讓敏感內容外泄。因此在4月內部信息泄露后,三星電子暫時禁止在內部PC上使用生成式AI。
三星集團董事長李在镕認為,為防止核心技術數據泄露,以及日益依賴于海外科技公司技術等原因,公司應該盡快開發自己的人工智能。
三星開發大模型的好處與挑戰
據韓媒報道,該項目從本月開始開發,三星為該項目投入了大量資源和人力,以確保其快速發展,該公司甚至限制其他業務部門在 6 月至 7 月期間使用 GPU資源。
三星電子聯席首席執行官 Kyung Kye-hyun表示,該大模型用以支持芯片業務部門員工的知識搜索和翻譯等任務,并計劃在12月推出基本服務,在明年2月推出更集成的服務。
根據該計劃,基于人工智能的系統有望支持九個關鍵領域,包括產品采購和成本管理的自動響應;芯片生產的知識搜索和數據分析;以及其他行政工作,例如內部會議記錄的翻譯和抄錄等。Kyung還透露,三星正在探索如何利用公司出色的技術為人工智能生態系統做出貢獻。
對于三星來說,開發自己的大語言模型有它的好處,其一人工智能可以幫助三星縮短軟件開發和半導體設計周期,減少人力成本和時間成本,提高競爭力;其二擁有自己的大語言模型,意味著公司不需要再依賴OpenAI、微軟和谷歌等的大模型產品,而造成信息可能泄露。
當然對于一家芯片廠商入局研究大語言模型,挑戰也是有的。大語言模型的開發,技術難度大、成本高,需要投入大量的計算資源和專業的人才進行開發和維護。可以看到,三星已經為此動員所有相關的人力和資源,并限制其他內部軟件開發組織使用GPU。
大語言模型的開發對計算資源的需求極大,數據顯示,如果以英偉達A100顯卡的處理能力計算,GPT-3.5大模型需要2萬塊GPU來處理訓練數據。業內公認,做好AI大模型的算力門檻需要1萬枚A100芯片,單從計算芯片的投入來看就已經要上百萬。
小結
如今大語言模型的強大能力已經眾所周知,然而作為企業來說,在使用第三方大語言模型產品的時候,難免會擔心自己的技術信息會被第三方機構搜集使用,造成機密泄露。而開發自己的大語言模型確實可以解決這個問題,不過對于企業來說,最好是具備足夠的資金和人才、技術積累才去涉足。