放棄 GitHub:時機已到?Copilot收費,惹怒軟體自由保護協會SFC

放棄 GitHub:時機已到?Copilot收費,惹怒軟體自由保護協會SFC

ADVERTISEMENT

誕生於 2008 年,如今已經 14 歲,憑藉完整協定支援、Git 格式的版本庫託管等優勢,GitHub 成為最受開發者歡迎的程式碼託管平臺。 

然而,GitHub 在被微軟收購,於去年推出 Copilot 後,這引發了行業內一些組織的不滿。因為 Copilot 被使用者發現就是複製/貼上別人的程式碼,所謂「原生 AI 程式碼產生工具」的宣傳不攻自破。 

同時,Copilot 也開啟收費模式。現以每月 10 美元(約台幣300 元)或每年 100 美元(約台幣3000元)的價格訂閱,並提供 60 天的免費試用期。 

放棄 GitHub:時機已到?Copilot收費,惹怒軟體自由保護協會SFC

GitHub 的種種做法引來 SFC 的強烈不滿,他們表示:其已停止使用微軟 GitHub 開展專案託管,並敦促其他軟體發展者一同退出。 

Copilot 收費,惹怒 SFC 

SFC(Software Freedom Conservancy)是一個旨在為自由開源軟體專案提供支援和基礎設施的非營利組織,成立於 2006 年。長期以來,SFC 一直得到 Google、Red Hat 和 Mozilla 等多家知名公司的財務支援,其領域範圍跨越 40 多個項目,包括 Git、Selenium 和 Godot。

放棄 GitHub:時機已到?Copilot收費,惹怒軟體自由保護協會SFC

 

其實 SFC 對 GitHub 的不滿早於 Copilot 的出現,事情的前因後果是這樣的: 

自從微軟及其子公司 GitHub 在去年首次推出 Copilot 以來,SFC 就一直在積極與微軟及其 GitHub 子公司進行溝通。 

2021 年 7 月,在與微軟和 GitHub 代表的首次視訊會議中,SFC 拋出了幾個問題,GitHub 方面表示他們當時無法回答,但會很快給出答覆。 

六個月過去了,SFC 沒有得到回應,其政策研究員 Bradley 隨即發表了題為《If Software is My Copilot, Who Programmed My Software? 》的文章,公開提出了這些問題(2021 年 7 月提出的問題)。 

文章發表後,GitHub 仍然沒有回答問題。三周後,SFC 成立了一個專家委員會,以考慮人工智慧輔助軟體道德影響,同時進行了一場公開討論。SFC 邀請微軟和 GitHub 的代表參加公開討論,但他們忽視該邀請。 

上周,SFC 提醒 GitHub (a)我們等了一年等待 GitHub 回答那些懸而未決的問題以及(b)GitHub 拒絕參加關於該主題的公開討論後,他們在一周後回復說他們不會加入關於此事的任何公開或私人討論,因為「關於人工智慧輔助軟體道德」 的更廣泛對話似乎不太可能改變 SFC 的立場,因此 GitHub 無需回應 SFC 的具體問題。換句話說,GitHub 對 Copilot 的最終立場是:如果你在 Copilot 相關的政策問題上與 GitHub 存在分歧,請你保留,你不值得微軟或 GitHub 回復。即便是敷衍、不受重視的回答,SFC 也等了一年。 

SFC 向 Microsoft/GitHub 提出的關於 Copilot 的三個主要問題(即他們一年來一直承諾給答案,但現在他們正式拒絕回答的問題)是: 

  1. 在微軟和 GitHub 的公開聲明中,GitHub(當時) 的 CEO 聲稱:(1) 訓練 ML 系統使用公共資料是合理的,(2) 輸出結果屬於操作者,其性質類似於編譯器。為了透明度和對自由 / 開源軟體社群的尊重,請向社群提供完整的法律分析。
  2. 如你們所聲稱的那樣,允許在任何程式碼上訓練模型(並允許使用者基於該模型產生程式碼)並且不受任何許可條款的約束,那你們為什麼只使用開源軟體來訓練 Copilot 模型?而 Microsoft Windows 和 Office 程式庫不在訓練集中?
  3. 你們能否提供一份 Copilot 訓練集中使用的許可列表,包括版權所有者的名稱和 / 或 Git 儲存庫的名稱? 如果沒有,為什麼要對社群隱瞞這些資訊? 

放棄 GitHub:時機已到?Copilot收費,惹怒軟體自由保護協會SFC

之後 Copilot 的收費直接惹怒了 SFC,原因在於此舉是在發生在 GitHub 推出商業版 Copilot 一周後才開始的。 

開源並不代表完全免費,程式碼「借用」怎麼算? 

Copilot 自去年首次亮相以來,在軟體發展領域便成了爭論的焦點,因為 Copilot 是建立在開源社群程式碼研究之上。事實上,Copilot 是與 OpenAI 合作開發的,OpenAI 是一家人工智慧研究機構,微軟早在 2019 年就投入了 10 億美元,並在很大程度上依賴於 OpenAI Codex,後者接受了大量公共原始程式碼和自然語言模型的訓練。 

Copilot 的發布引發了一些重要問題,這些問題圍繞「誰」才是軟體的實際編寫者展開。開源並不意味著完全免費,仍然需要滿足許可證要求和歸屬要求,因此如果 Copilot 從一個專案「借用」程式碼並將其推薦給另一個專案的作者,這一做法為版權侵權訴訟打開了閘門。關於什麼是合理使用以及 Copilot 引發的缺乏透明度問題,也有一大堆問題需要討論。 

考慮到開源軟體的核心理念是每個人都為獲得更大的利益而合作,沒有一方的利益比另一方更大,GitHub 決定以每月 10 美元的價格推出 Copilot(儘管對一些開發者是免費的),這一決定引發 SFC 強烈不滿。這意味著該組織將結束其內部對 GitHub 的使用,並引入一個程式來説明其成員將項目從 GitHub 上遷出。除此之外,SFC 還表示,如果新成員沒有明確的計畫將他們的開源專案從 GitHub 遷移出去,SFC 將不在與之進行合作。 

儘管社群中的許多人可能不同意 GitHub 透過專有產品將開源開發人員的勞動力貨幣化的這一做法,但現實情況是 GitHub 是全球軟體合作者事實上的平臺——這場運動很難獲得顯著動力,因為 GitHub 似乎已經成為全球數百萬開發人員離不開的平臺。 

GitHub、Copilot 並非獨一無二 

當然,科學研究人員除了 GitHub,還有其他選擇,例如 GitLab 的自託管社群版。 

值得注意的是,微軟的老對手亞馬遜最近推出了自己的 Copilot 版本,名為 CodeWhisperer。從發布中可以清楚地看出,亞馬遜正試圖解決 Copilot 引起的一些版權問題——例如,如果 CodeWhisperer 產生的程式碼建議類似於其訓練資料中的現有片段,它將突出顯示許可證與該原始函數相關聯。然後由開發人員決定是否使用該程式碼。 

圖片來源

儘管 SFC 在讓人們放棄 GitHub 方面可能取得成果,也可能失敗,但結合來自亞馬遜產品的競爭,它可能會對微軟施加足夠的壓力,以改變 Copilot 未來的運作方式——這樣它就能在程式碼建議的原始程式碼方面提供更多的透明度。

 

bigdatadigest
作者

大數據文摘(bigdatadigest)成立於2013年7月,專注數據領域資訊、案例、技術,在多家具有影響力的網站、雜誌設有專欄,致力於打造精準數據分析社群。

使用 Facebook 留言
方
1人給推

1.  (發表於 2022年7月05日 23:34)
微軟常常吃掉一些好公司後只是親手毀掉這些公司╮(╯_╰)╭
發表回應
謹慎發言,尊重彼此。按此展開留言規則