關於「開源人工智慧」術語的爭論為正式定義帶來了新的推動力

關於「開源人工智慧」術語的爭論為正式定義帶來了新的推動力


關於「開源人工智慧」術語的爭論為正式定義帶來了新的推動力
放大 / 一名男子凝視著玻璃隔板,尋求透明度。

開源倡議組織 (OSI) 最近宣布了「開源人工智慧」的最新定義草案,旨在澄清該術語在快速發展的領域中的模糊使用。此舉出台之際,Meta 等一些公司在使用「開源」標籤的同時,發布了經過訓練的人工智慧語言模型權重和具有使用限制的程式碼。這引發了自由軟體倡導者之間關於人工智慧背景下真正的「開源」的激烈爭論。

例如,Meta 的 Llama 3 模型雖然可以免費使用,但不符合 OSI 為軟體定義的傳統開源標準,因為它根據公司規模或模型生成的內容類型對使用施加了許可限制。 AI影像產生器Flux是另一個「開放式」模型,但並非真正開源。由於這種模糊性,我們通常使用「開放權重」或「來源可用」等替代術語來描述包含有限制的程式碼或權重或缺乏附帶訓練資料的人工智慧模型。

為了正式解決這個問題,以倡導開放軟體標準而聞名的 OSI 召集了大約 70 名參與者,包括研究人員、律師、政策制定者和活動人士。來自 Meta、谷歌和亞馬遜等主要科技公司的代表也加入了這項努力。該組織目前的開源人工智慧定義草案(版本0.0.9)強調“四個基本自由”,讓人想起自由軟體的定義:允許人工智慧系統的用戶在未經許可的情況下將其用於任何目的、研究它的工作原理、修改它出於任何目的,並在修改或不修改的情況下共享。

透過為開源人工智慧建立明確的標準,該組織希望提供一個評估人工智慧系統的基準。這可能有助於開發人員、研究人員和使用者就他們創建、研究或使用的人工智慧工具做出更明智的決策。

真正的開源人工智慧也可能揭示人工智慧系統潛在的軟體漏洞,因為研究人員將能夠看到人工智慧模型在幕後如何運作。將此方法與OpenAI 的ChatGPT 等不透明系統進行比較,後者不僅僅是一個具有精美介面的GPT-4o 大型語言模型,它是一個由互鎖模型和過濾器組成的專有系統,其精確的架構是一個嚴格保密的秘密。

OSI 的專案時間表表明,「開源 AI」定義的穩定版本預計將於 10 月在北卡羅來納州羅利舉行的 All Things Open 2024 活動上宣布。

“無需許可的創新”

在 5 月的新聞稿中,OSI 強調了定義開源人工智慧真正意義的重要性。 OSI 執行董事 Stefano Maffulli 表示:“人工智慧不同於常規軟體,它迫使所有利益相關者重新審視開源原則如何應用於該領域。” “OSI 相信每個人都應該保持對技術的代理和控制。我們也認識到,當明確的定義促進透明度、協作和無需許可的創新時,市場就會蓬勃發展。”

該組織最新的定義草案不僅限於人工智慧模型或其權重,還涵蓋整個系統及其組件。

人工智慧系統要獲得開源資格,必須提供對 OSI 所說的「進行修改的首選形式」的存取。這包括有關訓練資料的詳細資訊、用於訓練和運行系統的完整原始程式碼以及模型權重和參數。所有這些元素必須在 OSI 批准的許可或條款下可用。

值得注意的是,該草案並未強制要求發布原始訓練資料。相反,它需要“數據資訊”——有關訓練數據和方法的詳細元數據。這包括關於資料來源、選擇標準、預處理技術以及允許技術人員重新創建類似系統的其他相關細節的資訊。

「資料資訊」方法旨在提供透明度和可複製性,而不必披露實際資料集,表面上解決潛在的隱私或版權問題,同時堅持開源原則,儘管這一點可能需要進一步爭論。

「T他最有趣的事情是 [the definition] 獨立人工智慧研究員西蒙威利森 (Simon Willison) 在接受 Ars 採訪時就 OSI 的提案表示:“他們不允許公開訓練資料。”這是一種非常務實的方法——如果他們不允許這樣做,就幾乎不會有任何有能力的‘開源’模型。

More From Author

Barnes & Noble 帝國的締造者 Leonard Riggio 去世,享年 83 歲

Barnes & Noble 帝國的締造者 Leonard Riggio 去世,享年 83 歲

新生班要讀什麼

新生班要讀什麼

Leave a Reply

Your email address will not be published. Required fields are marked *

Recent Comments

No comments to show.

Categories