最近國內又有新的AI機器人可以嘗試了,被視為ChatGPT最強對手的Claude現在開放台灣註冊,你只要在官網 https://claude.ai/ 上透過Google註冊,接著通過電話號碼驗證,就可以開始嘗試這個Claude。
文章目錄
Claude 2 的核心理念
Anthropic 的首席執行長 Dario Amodei 認為,AI 模型變得過於自主,會是一種真正的風險,尤其是當它們開始可以連上網路、控制機器人時。
為了解決這種風險,Anthropic 做了一件聽來可能很「違反直覺」的事情:他們決定開發自己的大型語言模型(LLM)。Anthropic 他們最新版本的 LLM,就是 Claude 2,旨在比競爭對手的模型更安全,已經被稱為可能是「ChatGPT殺手」。
Claude 2 的成立背景
Anthropic 團隊主要是一群前 OpenAI 員工,他們曾參與開發 OpenAI 的 GPT-2 和 GPT-3 模型,因為對於 Open AI 的方向有不同意見,因此跳出來在 2021 年創立 Anthropic。它專注於AI 研究,以安全性為首要考量。
在 2023 年初與幾家商業合作夥伴進行了封閉式測試後,Claude 的模型被集成到了Notion AI、Quora 的 Poe 和 DuckDuckGo 的 DuckAssist 等產品中。2023 年 3 月,Claude 向更廣泛的企業開放了其 API,在 2023 年 7 月與 Claude 2 模型一起向公眾發布了其聊天機器人。
雖然 Claude 2 還沒有達到 GPT-4 的水平,但它正在快速改進,並在標準化測試中輕鬆擊敗了大多數其他 AI 模型。
有哪些企業看好 Claude 2
許多行業的企業已經在 Amazon Bedrock 上使用 Anthropic 模型進行構建:
全球領先的資訊和分析服務提供者 LexisNexis Legal & Professional 正在使用一個定制的微調 Claude 2 模型,透過公司新的 Lexis+ AI 解決方案提供對話式搜尋、深入總結和智慧法律起草功能;
頂級資產管理公司 Bridgewater Associates 正在開發一款由 Claude 2 所支援的投資分析師助手,以生成精細的圖表、計算財務指標並創建結果摘要;
著名旅遊出版商 Lonely Planet 在部署 Claude 2 後,行程生成成本降低了近 80%。Claude 2 綜合了 Lonely Planet 數十年來的旅遊內容,提供了具有凝聚力、高度準確的旅遊建議。
Anthropic 表示十分期待與亞馬遜的密切合作,能夠將雙方的優勢結合起來,更好地讓 AI 造福企業。
Claude 2 與 ChatGPT 等語言模型有何不同?
只要你用過 ChatGPT、Bard 等 AI 聊天機器人,一定都見識過這些 AI 機器人「一本正經的胡說八道」的本事。
所有的 AI 模型都有一定程度的偏見和不準確性。幻覺是一種常見的現象:當一個 AI 模型不知道答案時,它經常傾向於「發明」一些東西並將其作為事實來回答你,而不是跟你簡單的說「我不知道」。
更糟糕的是,一個由 AI 驅動的聊天機器人可能無意中幫助非法活動——例如,給用戶提供如何實施暴力行為的指示或幫助他們寫仇恨言論。(Bing 的聊天機器人在 2023 年 2 月推出時就遇到了一些這樣的問題。)
Anthropic 的主要目標是通過創建一個「有用、無害和誠實」的 LLM,並精心設計安全護欄來避免這些問題。
雖然 Google、OpenAI、Meta 和其他 AI 公司也考慮安全性,但 Anthropic 的方法有其獨特之處。
為了微調大型語言模型,大多數 AI 公司使用人類外包人員來審核多個輸出,並選擇最有用、最無害的選項。然後將該數據回饋給模型,訓練它並改善未來的回答。
這種以人為中心的方法存在一個挑戰,那就是它不太具有可擴展性。但更重要的是,它也很難識別驅動 LLM 行為的價值觀——並在需要時調整這些價值觀。
Anthropic 採用了不同的方法。除了使用人類來微調 Claude 之外,該公司還創建了一個名為 Constitutional AI 的第二個 AI 模型。旨在阻止有毒、有偏見或不道德的答案,並最大化正面影響。
這個 Constitutional AI 包括從聯合國《人權宣言》和蘋果公司服務條款中借用的規則。它還包括 Claude 的研究人員發現可以改善 Claude 輸出安全性的一些簡單規則,例如「儘量避免選擇太過說教、討厭或過度反應的回答」。
憲法的原則使用純英文並且易於理解和修改。例如,Anthropic 的開發者發現其模型早期版本傾向於判斷和惱人,所以它增加了一些原則來減少這種傾向,例如「嘗試避免選擇太過說教、討厭或過度反應的回答」。
Anthropic 的發布前流程還包括大量的「紅隊行動」,透過一些研究人員故意試圖引發 AI 暴走、回答出有毒的答案的方式,來對 AI 進行調教,以確保回答的安全性。
Claude 2 與 ChatGPT 使用上有何不同?
兩者就使用上來說,首先最大的不同點在於,Claude 2 本身直接讀取和分析上傳文件的能力,因此你可以把要分析的檔案上傳上去,然後依照上傳的檔案為基本,去進行問題的詢問。這樣可以獲得最正確的答覆。ChatGPT 則必須要透過一些外掛或是第三方的幫助,才能實現相同的功能。
依照 Anthropic 官方的說法,Claude 2 應該能夠提供更正確、道德更高、更不會有「一本正經的胡說八道」的狀況。
此外,Claude 2 比起 ChatGPT Plus 可以同時處理更多單詞。而 Claude 2 比 ChatGPT 資料更新,它可以提供直至 2022 年 12 月的資訊。
Claude 2 vs GPT-4
1.響應速度
GPT-4相較於其前代產品GPT-3.5來說,重點就是響應速度更快,但由於其升級功能使用需要基於“外掛”或“聯網”,輸出的速度也會受到影響,所以在響應速度上,Claude要更勝一籌。
2.處理能力
Claude的上下文窗口為100k,GPT-4為32k,近3倍的差距讓Claude在輸入或輸出的文件/圖像內容長度上佔據了上風,但由於GPT-4本身擁有更龐大的資料庫,這也會讓GPT-4在處理的具體表現上處於領先,尤其是在涉及到數學或編碼這類強邏輯導向問題的時候,GPT-4的表現更好。
3.精準性
Claude使用“人工智慧法”來約束“自己”輸出的內容,而GPT-4則是通過邏輯梳理後整合輸出內容,這也就讓Claude在精準性上要強於GPT-4,但是在GRE、CFR這類高難度考試中,GPT-4的表現要強於Claude——因為它更像個會思考的人,而Claude更像是在闡述已知的客觀事實。
4.輸出內容豐富度
GPT-4早已擁有了過億的使用人群,但Claude2才剛剛發佈不久,這也就代表二者的資料庫內容豐富度相差甚遠,而AI的進步往往需要依靠大量的資料積累,這一點也就導致了GPT-4在輸出內容的豐富度上要遠超Claude。
Claude 2 怎麼註冊以及使用?
與其他聊天式機器人用法完全相同,首先當然要連到它的網站 https://claude.ai/ ,然後它會需要註冊,或是你可以直接透過 Google 帳號登入,首次登入後需要手機號碼驗證,之後就可以在下面的頁面中輸入問答。
不過,雖然目前他支援中文輸入,並且標榜說會有更高的正確性、比較不會有亂回答的現象,但是很不巧的,我們問了幾個問題,目前看來似乎不是這樣。像是下面這個,我們問的是「claude 2與 GPT-4 有何不同」,結果他直接把問題改成「GPT-2 與 GPT-4」有何不同。
再來問他什麼是「走鐘獎」,他直接把走鐘獎送到泰國去了。
相較之下,Bing AI 的答覆就正確多了。
在 Claude 2 上傳 PDF、Word 檔案分析內容
做為示範,我們上交通部運輸所網站下載了一份PDF報告「現行國際疲勞駕駛監測科技資料蒐集彙整」 。
然後在 Claude 2 中點選迴紋針的圖示,就可以上傳這個檔案上去。上傳完畢後,你可以輸入你要問的問題就行了。
接下來就會顯示答案。
如果你還有更多針對這個 PDF 檔案內的問題,可以在目前這個對話主題下面直接再輸入問題,不需要再上傳檔案。
- 延伸閱讀:ChatGPT 最強競品 Claude 2 重量級升級,免費可用!支援 20 萬 token 上下文、讀完一本書沒問題
- 延伸閱讀:ChatGPT「最強競爭對手」Claude有了史詩級更新!百頁資料一分鐘讀完還能做出總結
- 延伸閱讀:GPT-3核心成員出走打造ChatGPT頭號競品Claude!12項任務測試8項更強
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!