Meta,這家科技巨擘,發現自己身陷新一波的批評浪潮之中,正面臨著「開放清洗」(open washing) 的指控。這場爭議源於它贊助了一份 Linux 基金會的研究報告,該報告深入探討了蓬勃發展的開源 AI 解決方案。問題的核心在於,人們認為 Meta 正在利用這種贊助來推廣自己的 Llama AI 模型,同時迴避了「開源」的真正定義。
Linux 基金會研究:一把雙面刃
Linux 基金會的這份研究報告於本月初發布,它大力提倡開源 AI 系統的優勢,強調它們對各種規模的企業,尤其是小型企業的成本效益。該研究表明,選擇封閉源碼 AI 模型的組織,其軟體費用可能比使用開源替代方案的組織高出三倍半。
這項研究與越來越多的證據相符,這些證據支持開源 AI 的好處。例如,IBM 和 Morning Consult 在 1 月份進行的一項調查顯示,超過一半使用開源 AI 工具的企業更有可能獲得正面的投資回報率 (ROI)。此外,尚未採用開源 AI 解決方案的受訪者中,有五分之二表示他們打算在未來一年內將這些工具整合到他們的 AI 專案中。
然而,Meta 對 Linux 基金會研究的參與引發了爭議,批評人士認為這是一場為該公司的 Llama AI 模型精心策劃的行銷活動。
「開源」困境:Llama 受到審查
OpenUK 的 CEO Amanda Brock 聲稱,Meta 的 Llama 模型不符合被歸類為真正「開源」的必要標準。她指出,Meta 和研究報告都沒有承認這種差異。
「無論你選擇哪個定義,Llama 都不是『開源』,」Brock 說。「我個人更喜歡來自開放源碼促進會 (OSI) 的開放源碼軟體定義 (OSD)。由於多種原因,包括在其許可協定中納入了商業限制,Llama 未能達到其開源標準。」
Brock 進一步闡述了這種限制所帶來的影響:「這種限制擾亂了開源許可的核心自由流動,並產生了摩擦。我們仰賴開源能夠被任何人用於任何目的,而 Llama 並未滿足此項要求。」
Meta 的開源聲明:一個有爭議的問題
Meta 的 Llama 模型系列被標記為「開源」,但該公司在關於此聲明的問題上,一直面臨著來自產業利害關係者的挑戰。爭論的主要點圍繞著對「開源」的真正構成的不同解釋。
分歧的核心在於,一旦使用者達到一定程度的商業化,就會對他們施加許可條款。雖然 Llama 模型提供開放存取,但在特定情況下會對使用者施加限制。
今年稍早,開放源碼促進會 (OSI) 公開批評了 Meta 在此問題上的做法,聲稱該公司「持續錯誤地宣傳 Llama 為開源」。
Brock 承認 Meta 在推廣開源意識方面所做的 Llama 系列努力是「朝著正確方向邁出的一步」,但她強調,仍需取得重大進展才能有效解決科技產業內的「開放清洗」問題。
「考量到 Meta 的網站將其報告中的一項關鍵結論強調為『Linux 基金會的研究顯示,像 Llama 這樣的開源 AI 模型,透過使關鍵的科技解決方案更容易取得,從而推動經濟成長、創新和競爭』,難怪 OSI 會感到憤怒並指責 Linux 基金會支持開放清洗,」Brock 指出。
她進一步強調了開放清洗更廣泛的影響,聲稱:「開放清洗今天不僅僅是一個開源問題。隨著像歐盟 (EU) 這樣的監管機構將開放源碼一詞用作 AI 責任豁免的基礎,以及 AI 中必須滿足的標準,開放清洗的影響已成為一個社會問題。」
超越 Meta:更廣泛的產業趨勢
Meta 並不是唯一一家陷入開源定義辯論之中的產業開發商。
在 2024 年 3 月,Databricks 推出了它自己的大型語言模型 DBRX,專家也聲稱該模型不符合開源標準。這歸因於納入了一項外部可接受使用政策,以及它在 OSI 架構管轄範圍之外的許可下運作。DBRX 爭議進一步強調了「開放源碼」一詞的模糊性和複雜性,以及開發人員在駕馭其各種解釋時面臨的挑戰。這場辯論突顯了在定義開源原則方面需要更大的清晰度和標準化,特別是在快速發展的人工智慧領域。如果沒有一個普遍接受的定義,「開放清洗」的風險將繼續存在,並可能破壞開源運動的信譽和完整性。
定義開源:核心原則
為了理解圍繞 Meta 的 Llama 和 Databricks 的 DBRX 的爭議,深入研究定義開源軟體的根本原則至關重要。開放源碼促進會 (OSI) 提供了一個廣泛認可的定義,概述了軟體許可必須滿足的十項關鍵標準才能被視為開源:
- 自由再散布: 許可不得限制任何一方將軟體作為包含來自多種不同來源的程式的聚合軟體發布的一部分出售或贈送。許可不得要求對此類銷售收取權利金或其他費用。
- 原始碼: 程式必須包含原始碼,並且必須允許以原始碼以及編譯形式發布。如果某種形式的產品不是隨原始碼發布的,則必須有一種公開的方式以不超過合理的重製成本來獲取原始碼——最好是透過網路免費下載。原始碼必須是程式設計師修改程式的首選形式。不允許故意混淆的原始碼。不允許諸如預處理器或翻譯器的輸出之類的中間形式。
- 衍生作品: 許可必須允許修改和衍生作品,並且必須允許它們以與原始軟體的許可相同的條款發布。
- 作者原始碼的完整性: 許可可能限制以修改形式發布原始碼,前提是許可允許發布帶有原始碼的「修補程式檔案」,以便在建置時修改程式。許可必須明確允許發布從修改後的原始碼建置的軟體。許可可能要求衍生作品帶有與原始軟體不同的名稱或版本號碼。
- 不得歧視個人或群體: 許可不得歧視任何個人或群體。
- 不得歧視活動領域: 許可不得限制任何人將程式用於特定活動領域。例如,它不得限制該程式在企業中使用,或用於基因研究。
- 許可的發布: 附加到程式的權利必須適用於所有重新發布該程式的人,而無需這些人執行額外的許可。
- 許可不得特定於產品: 附加到程式的權利不得取決於該程式是否為特定軟體發布的一部分。如果該程式從該發布中提取並在該程式許可的條款內使用或發布,則所有重新發布該程式的人都應享有與原始軟體發布相關的相同權利。
- 許可不得限制其他軟體: 許可不得限制與許可軟體一起發布的其他軟體。例如,許可不得堅持認為在同一媒體上發布的所有其他程式都必須是開源軟體。
- 許可必須是技術中性的: 許可的任何條款都不可以基於任何單獨的技術或介面樣式。
這些原則強調了開源生態系統中自由、透明和協作的重要性。當軟體許可偏離這些原則時,就會引發關於該軟體是否可以真正被視為開源的問題。在 Meta 的 Llama 和 Databricks 的 DBRX 的案例中,擔憂圍繞著商業限制、可接受使用政策和可能未完全符合 OSI 定義的許可架構。
「開放清洗」的影響
「開放清洗」這種行為,即公司在軟體未完全滿足標準時錯誤地將其描述為開源軟體,可能會產生一些負面後果:
- 信任的侵蝕: 它會侵蝕對整個開源運動的信任,使得使用者難以區分真正的開源專案和僅僅是假裝的專案。
- 貢獻的阻礙: 它會阻礙致力於開源原則的開發人員的貢獻,因為他們可能會覺得自己的努力被不遵守遊戲規則的公司所破壞。
- 法律上的不確定性: 它會為依賴該軟體的使用者造成法律上的不確定性,因為他們可能不確定自己在許可下的權利和義務。
- 創新的阻礙: 它會透過限制修改和重新發布軟體的自由來阻礙創新,而這是開源社群中創新的主要驅動力。
因此,公司必須透明地披露其軟體的許可條款,並避免對其開源狀態做出誤導性聲明。
需要更大的清晰度和標準化
圍繞 Meta 的 Llama 和 Databricks 的 DBRX 的持續辯論突顯了在定義開源原則方面需要更大的清晰度和標準化。缺乏普遍接受的定義會造成混淆,並允許公司利用漏洞並從事「開放清洗」。
目前正在進行一些措施來解決此問題:
- 開放源碼促進會 (OSI): OSI 繼續在定義和推廣開源原則方面發揮關鍵作用。它提供了廣泛認可的開源定義,並認證符合其標準的許可。
- Linux 基金會: Linux 基金會致力於促進開源社群中的協作和創新。它為開源專案提供了一個平台,並主辦將開發人員、使用者和公司聚集在一起的活動。
- 歐盟 (EU): 歐盟越來越認識到開源的重要性,並將其納入其政策和法規中。它正在使用「開源」一詞作為 AI 責任豁免以及 AI 中必須滿足的標準的基礎。
這些措施有助於建立一個更加透明和標準化的開源生態系統。然而,還需要做更多的工作來確保開源原則得到明確定義並始終如一地應用。
前進:透明度和責任制
為了有效打擊「開放清洗」並推廣真正的開源,需要採取多方面的措施:
- 透明度: 公司必須透明地揭露其軟體的許可條款,並避免對其開源狀態做出誤導性聲明。
- 責任制: 產業組織和監管機構必須對公司在其開源聲明中的行為負責,並對從事「開放清洗」的公司採取行動。
- 教育: 需要對使用者和開發人員進行關於開源原則的教育,以及如何識別真正的開源專案。
- 協作: 開源社群必須繼續協作,以定義和推廣開源原則,並開發有助於使用者和開發人員駕馭開源生態系統的工具和資源。
透過共同努力,我們可以建立一個更透明、負責任和創新的開源生態系統,讓每個人都受益。人工智慧和其他技術的未來取決於此。