ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

讓眾人瘋狂的網紅AI ChatGPT,其實有些時候,答案並不是那麼的可靠。

最近,一段「網友調教這只AI」的聊天記錄,在網上傳開了。可以看到,AI起初居然說27是個質數。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

 

 

在網友向其提出質疑後,AI仍嘴硬稱「27不能被3整除」。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

網友不得不和AI「大戰幾百回合」,最後在人類鍥而不捨的教導下,AI才終於終於低頭認錯。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

AI的認錯態度倒是很好。有圍觀者看完後調侃:AI不是都要統治世界了嗎,怎麼會輸給一道簡單的數學題?

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

不過,也有很多人為ChatGPT說話:這麼坦誠的認錯態度,比某些人強多了。

 

網友在和ChatGPT互動的過程中發現,這只AI數學程度不怎麼樣,連27是不是質數這種簡單問題都能搞錯——而且還是在知道質數定義的情況下……

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

於是網友讓ChatGPT證明它給出的結論,沒想到,AI居然說27不能被3整除。

網友表示無語,但還是耐著性子又問了一遍,結果AI依然嘴硬,偏把9說成是9.0。無奈,網友只能搬出程式碼,試著用Python來教會AI。

結果AI還真學會了!而且人家還主動承認了剛才的錯誤。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

有意思的是,我們剛才也去問了ChatGPT“27是不是質數”,發現它已經改過來了。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

然後我們又拿了幾個數字去問AI,結果在這一回合中,它都正確地判斷了一個數到底是不是質數。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

不過仔細一看,AI並沒提到35能被7整除,於是我們又專門問了一遍。結果……

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

這豈不是一本正經地胡說八道嘛?

於是我們也只好搬出Python教教它,但這回,連python似乎也沒能讓AI承認自己的錯誤……

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

所以這只AI為什麼算術能力如此堪憂,而且還如此固執?

其中一個重要的原因就是,ChatGPT是個基於語言的大數據模型,根據Open AI的GPT-3.5的模型微調而成,它擅長邏輯推理,但並不能執行標準的電腦演算法。

而且與搜尋引擎不同,它目前也沒有網頁瀏覽功能,無法連線到一些線上計算功能的網頁去求解。

先前,ChatGPT其實已經向使用者坦言,它不懂算術。兩位數的乘法或許還勉強,但遇到三位數的乘法,人家直接不幹了。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

我們也去問了一遍,現在AI到是直接給了個答案,不過是錯的。(正確答案為186524)

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

另外,ChatGPT一般不會根據使用者的反饋來糾正自己的答案,但如果使用者提出了額外的資訊,有時也能輔助AI最佳化答案。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

所以,我們暫時沒有成功地「教育」AI,大概也許可能是運氣不太好……

除了數學其他都很全能

儘管ChatGPT有時會展現出“人工智障”的一面,但不得不說,大多數時候它的表現還是很優秀的。

比如,哥倫比亞大學教授、Google工程師Kenneth Goodman就分享,ChatGPT已經做好成為律師的準備了!

在律師執業考試中,ChatGPT的正確率高達70%(35/50)。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

 

不僅是法律方面,Goodman還讓ChatGPT參加了其他不同領域的各種考試,都取得了很高的成績。

包括美國醫師執照考試(USMLE),拿掉其中的圖像選擇題後,ChatGPT同樣做到了70%的正確率。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

為了防止ChatGPT的訓練資料中包含這些題目,Goodman還特意選取了紐約州2022年8月最新化學註冊考試:

去除5個圖片選擇題,ChatGPT的正確率為77.7%(35/45)。

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

同樣批次的英語考試中,ChatGPT的正確率甚至達到了91.6%(22/24)

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

有網友已經開始預測,或許我們每個人都將擁有自己的律師AI了,諮詢律師的費用也會大大下降。接下來就是醫生AI、營養師AI……

ChatGPT固執又嘴硬、不承認「27能被3整除」,網友:你這樣怎麼征服世界?

怎麼樣,你看好ChatGPT的未來應用嗎?或者你有讓它學好數學的建議嗎?

參考連結:

[1]https://weibo.com/7095186006/Mj6LVF0zS#comment

[2]https://twitter.com/TonyZador/status/1601316732689604608

[3]https://twitter.com/pythonprimes/status/1601664776194912256

Qbitai
作者

量子位(Qbitai)專注於人工智慧及前沿科技領域,提供技術研發趨勢、科技企業動態、新創公司報道等最新資訊,以及機器學習入門資源、電腦科學最新研究論文、開源程式碼和工具的相關報導。

使用 Facebook 留言
emmausa
3.  emmausa (發表於 2023年11月08日 11:38)
ChatGPT 是一個大型語言模型,但尚未完成。 它可以產生文字、翻譯語言、編寫不同類型的創意內容,並以翔實的方式回答您的問題。 然而,仍然有可能犯下基本錯誤,例如不理解簡單的計算 slither io
Emily_Wilson
6.  Emily_Wilson (發表於 2024年3月27日 10:50)
很高兴您撰写了有关 GPT 聊天主题的文章。 它使用语言数据来“推断”并提供答案,但这种能力可能会受到复杂数学问题的限制。 我非常感谢 incredibox 它可以帮助我缓解压力!
ysekopi
7.  ysekopi (發表於 2024年6月08日 15:05)
Bibicopy is a premium online store for luxury brands. It offers new 2024 models at discount prices, with reliable cash-on-delivery options and top-tier reviews. Known for its trustworthiness and quality assurance, Bibicopy is your go-to for luxury goods. https://www.bibicopy.net/
發表回應
謹慎發言,尊重彼此。按此展開留言規則