學生濫用 AI 寫論文,OpenAI 擁有 99.9% 準確率的檢測工具,為何遲遲不發布?

學生濫用 AI 寫論文,OpenAI 擁有 99.9% 準確率的檢測工具,為何遲遲不發布?

ADVERTISEMENT

OpenAI 擁有一種方法,可以可靠地檢測出有人使用 ChatGPT 來撰寫論文或研究報告。儘管人們普遍擔心學生使用人工智慧作弊,但該公司尚未發布這項技術。

據知情人士和《華爾街日報》查閱的內部文件顯示,該項目在 OpenAI 內部已經辯論了大約兩年,並且已經準備好發表大約一年。「這只是按下按鈕的問題,」其中一位知情人士表示。

在試圖決定如何處理時,OpenAI 的員工們在公司聲明的透明度承諾和吸引及留住使用者的願望之間搖擺不定。該公司對 ChatGPT 忠實使用者進行的一項調查發現,近三分之一的人會因為反作弊技術而不再使用。

OpenAI 發言人表示,公司擔心該工具可能會對非英語母語人士等群體產生不成比例的影響。「我們正在開發的文本水印方法在技術上有前景,但存在我們正在權衡的重要風險,同時也在研究替代方案,」她表示。「我們認為,考慮到問題的複雜性及其對 OpenAI 以外更廣泛生態系統的可能影響,我們採取的謹慎做法是必要的。」

支持發布該工具的員工,包括那些幫助開發它的人,在內部表示,這些論點與這種技術可能帶來的好處相比相形見絀。

生成式 AI 可以在幾秒鐘內,根據一個簡單的提示,免費創建一整篇論文或研究報告。教師和教授們表示,他們迫切需要幫助來打擊這種濫用行為。

「這是一個巨大的問題,」紐約市高中英語和新聞學教師 Alexa Gutterman 表示。「這是我接觸的每位教師都在談論的事情。」

科技政策非營利組織民主與技術中心最近的一項調查發現,59% 的中學和高中教師確信一些學生使用過 AI 來幫助完成學業,比上一學年增加了 17 個百分點。

OpenAI 執行長 Sam Altman 和首席技術長 Mira Murati 參與了關於反作弊工具的討論。一些知情人士表示,Altman 鼓勵該項目,但並沒有推動其發布。

99.9% 有效

ChatGPT 由一個 AI 系統驅動,該系統預測句子中下一個單詞或單詞片段(稱為 token)應該是什麼。OpenAI 正在討論的反作弊工具將會稍微改變 token 的選擇方式。這些改變會留下稱為水印的模式。

水印對人眼來說是不可見的,但可以使用 OpenAI 的檢測技術找到。該檢測器提供了一個分數,表示整個文件或其一部分由 ChatGPT 撰寫的可能性有多大。

根據內部文件,當 ChatGPT 創建足夠多的新文本時,水印的有效性為 99.9%。

「太陽明天就蒸發的可能性比這篇學期論文沒有水印的可能性更大,」史丹福大學研究員 John Thickstun 表示,他是為 AI 文本開發類似水印方法的團隊的一員。

儘管如此,一位熟悉此事的 OpenAI 員工表示,認為水印可能會透過一些簡單的技術被抹去,例如讓 Google 翻譯將文本翻譯成另一種語言然後再翻譯回來,或者讓 ChatGPT 在文本中加入表情符號然後手動刪除它們。

公司內部普遍認為,確定誰可以使用這個檢測器將是一個挑戰。如果太少人擁有它,該工具就沒有用處。如果太多人獲得存取權限,壞人可能會破解公司的水印技術。

OpenAI 員工已經討論過直接向教育工作者或向幫助學校辨識 AI 撰寫論文和抄襲作品的外部公司提供檢測器。

Google 開發了一種水印工具,可以檢測其 Gemini AI 生成的文本。該工具名為 SynthID,目前處於 beta 測試階段,尚未廣泛使用。

OpenAI 有一個工具可以確定圖像是否使用其文生圖產成器 DALL-E 3 創建,該生成器已於今年春天發布用於測試。熟悉此事的員工表示,該公司優先考慮音訊和視覺水印而不是文本水印,因為危害更嚴重,尤其是在美國繁忙的選舉年。

關於蝙蝠俠的論文

2023 年 1 月,OpenAI 發布了一種演算法,旨在檢測由多個 AI 模型(包括其自己的模型)編寫的文本。但它的成功率只有 26%,OpenAI 在七個月後將其撤回。

還有其他由外部公司和研究人員開發的工具來檢測 AI 創建的文本,許多教師說他們已經使用過這些工具。但它們有時無法檢測到由先進的大型語言模型編寫的文本,並且可能產生誤報。

起初,學生們「認為我們擁有所有這些神奇的魔法技巧來判斷他們是否在使用 AI,」最近在喬治亞州一所私立高中任教的 AI 教育顧問 Mike Kentz 表示。「到了年底……他們會想,等一下,我的老師根本不知道。」

一些老師鼓勵學生使用 AI 來幫助研究或提供想法的回饋。問題是,當學生們讓像 ChatGPT 這樣的應用程式完成所有工作時,他們甚至不知道自己提交的是什麼。

去年,猶他大學政治學教授 Josh McCrain 給學生們安排了一項寫作任務,其中包括以難以辨認的小字體指示學生們提到蝙蝠俠。如果他們將作業複製並貼到 AI 中,這些指示就會被納入。

果然,有幾名學生繳交了具有對蝙蝠俠莫名其妙的引用的論文。展望未來,McCrain 正在調整寫作任務,更多地關注 AI 不太熟悉的時事,並懇求學生不要將他們的工作外包給 AI。「這是我試圖真正向學生們強調的一點:你們需要學習這些東西,」他表示。

「我們為缺乏文本水印進行辯護的能力現在很弱,因為我們知道它不會降低輸出品質,」參與測試的員工得出結論,根據內部文件。

6 月初,OpenAI 的高級員工和研究人員再次召開會議討論該項目。該小組一致認為水印技術運作良好,但去年 ChatGPT 用戶調查的結果仍然影響巨大。據了解會議情況的人士透露,員工們說公司應該研究其他可能在用戶中引起較少爭議但尚未經過驗證的方法。

內部文件顯示,他們還表示,OpenAI 需要在今年秋季之前制定計劃,以扭轉公眾對 AI 透明度的看法,以及潛在的 AI 透明度新法律。

「如果沒有這個,我們作為負責任的行為者的信譽就有風險。」6 月會議的總結表示。

netizen
作者

一個老派的科技媒體工作者,對於最新科技動態、最新科技訊息的觀察報告。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則