Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

最近國內又有新的AI機器人可以嘗試了,被視為ChatGPT最強對手的Claude現在開放台灣註冊,你只要在官網 https://claude.ai/ 上透過Google註冊,接著通過電話號碼驗證,就可以開始嘗試這個Claude。

文章目錄

Claude 2 的核心理念

Anthropic 的首席執行長 Dario Amodei 認為,AI 模型變得過於自主,會是一種真正的風險,尤其是當它們開始可以連上網路、控制機器人時。

為了解決這種風險,Anthropic 做了一件聽來可能很「違反直覺」的事情:他們決定開發自己的大型語言模型(LLM)。Anthropic 他們最新版本的 LLM,就是 Claude 2,旨在比競爭對手的模型更安全,已經被稱為可能是「ChatGPT殺手」。 

Claude 2 的成立背景

Anthropic 團隊主要是一群前 OpenAI 員工,他們曾參與開發 OpenAI 的 GPT-2 和 GPT-3 模型,因為對於 Open AI 的方向有不同意見,因此跳出來在 2021 年創立 Anthropic。它專注於AI 研究,以安全性為首要考量。

在 2023 年初與幾家商業合作夥伴進行了封閉式測試後,Claude 的模型被集成到了Notion AI、Quora 的 Poe 和 DuckDuckGo 的 DuckAssist 等產品中。2023 年 3 月,Claude 向更廣泛的企業開放了其 API,在 2023 年 7 月與 Claude 2 模型一起向公眾發布了其聊天機器人。

雖然 Claude 2 還沒有達到 GPT-4 的水平,但它正在快速改進,並在標準化測試中輕鬆擊敗了大多數其他 AI 模型。

有哪些企業看好 Claude 2

許多行業的企業已經在 Amazon Bedrock 上使用 Anthropic 模型進行構建: 

全球領先的資訊和分析服務提供者 LexisNexis Legal & Professional 正在使用一個定制的微調 Claude 2 模型,透過公司新的 Lexis+ AI 解決方案提供對話式搜尋、深入總結和智慧法律起草功能;

頂級資產管理公司 Bridgewater Associates 正在開發一款由 Claude 2 所支援的投資分析師助手,以生成精細的圖表、計算財務指標並創建結果摘要;

著名旅遊出版商 Lonely Planet 在部署 Claude 2 後,行程生成成本降低了近 80%。Claude 2 綜合了 Lonely Planet 數十年來的旅遊內容,提供了具有凝聚力、高度準確的旅遊建議。

Anthropic 表示十分期待與亞馬遜的密切合作,能夠將雙方的優勢結合起來,更好地讓 AI 造福企業。

Claude 2 與 ChatGPT 等語言模型有何不同?

只要你用過 ChatGPT、Bard 等 AI 聊天機器人,一定都見識過這些 AI 機器人「一本正經的胡說八道」的本事。

所有的 AI 模型都有一定程度的偏見和不準確性。幻覺是一種常見的現象:當一個 AI 模型不知道答案時,它經常傾向於「發明」一些東西並將其作為事實來回答你,而不是跟你簡單的說「我不知道」。

更糟糕的是,一個由 AI 驅動的聊天機器人可能無意中幫助非法活動——例如,給用戶提供如何實施暴力行為的指示或幫助他們寫仇恨言論。(Bing 的聊天機器人在 2023 年 2 月推出時就遇到了一些這樣的問題。)

Anthropic 的主要目標是通過創建一個「有用、無害和誠實」的 LLM,並精心設計安全護欄來避免這些問題。

雖然 Google、OpenAI、Meta 和其他 AI 公司也考慮安全性,但 Anthropic 的方法有其獨特之處。

為了微調大型語言模型,大多數 AI 公司使用人類外包人員來審核多個輸出,並選擇最有用、最無害的選項。然後將該數據回饋給模型,訓練它並改善未來的回答。

這種以人為中心的方法存在一個挑戰,那就是它不太具有可擴展性。但更重要的是,它也很難識別驅動 LLM 行為的價值觀——並在需要時調整這些價值觀。

Anthropic 採用了不同的方法。除了使用人類來微調 Claude 之外,該公司還創建了一個名為 Constitutional AI 的第二個 AI 模型。旨在阻止有毒、有偏見或不道德的答案,並最大化正面影響。

這個 Constitutional AI 包括從聯合國《人權宣言》和蘋果公司服務條款中借用的規則。它還包括 Claude 的研究人員發現可以改善 Claude 輸出安全性的一些簡單規則,例如「儘量避免選擇太過說教、討厭或過度反應的回答」。

憲法的原則使用純英文並且易於理解和修改。例如,Anthropic 的開發者發現其模型早期版本傾向於判斷和惱人,所以它增加了一些原則來減少這種傾向,例如「嘗試避免選擇太過說教、討厭或過度反應的回答」。

Anthropic 的發布前流程還包括大量的「紅隊行動」,透過一些研究人員故意試圖引發 AI 暴走、回答出有毒的答案的方式,來對 AI 進行調教,以確保回答的安全性。

Claude 2 與 ChatGPT 使用上有何不同?

兩者就使用上來說,首先最大的不同點在於,Claude 2 本身直接讀取和分析上傳文件的能力,因此你可以把要分析的檔案上傳上去,然後依照上傳的檔案為基本,去進行問題的詢問。這樣可以獲得最正確的答覆。ChatGPT 則必須要透過一些外掛或是第三方的幫助,才能實現相同的功能。

依照 Anthropic 官方的說法,Claude 2 應該能夠提供更正確、道德更高、更不會有「一本正經的胡說八道」的狀況。

此外,Claude 2 比起 ChatGPT Plus 可以同時處理更多單詞。而 Claude 2 比 ChatGPT 資料更新,它可以提供直至 2022 年 12 月的資訊。

Claude 2 vs GPT-4

1.響應速度

GPT-4相較於其前代產品GPT-3.5來說,重點就是響應速度更快,但由於其升級功能使用需要基於“外掛”或“聯網”,輸出的速度也會受到影響,所以在響應速度上,Claude要更勝一籌。

2.處理能力

Claude的上下文窗口為100k,GPT-4為32k,近3倍的差距讓Claude在輸入或輸出的文件/圖像內容長度上佔據了上風,但由於GPT-4本身擁有更龐大的資料庫,這也會讓GPT-4在處理的具體表現上處於領先,尤其是在涉及到數學或編碼這類強邏輯導向問題的時候,GPT-4的表現更好。

3.精準性

Claude使用“人工智慧法”來約束“自己”輸出的內容,而GPT-4則是通過邏輯梳理後整合輸出內容,這也就讓Claude在精準性上要強於GPT-4,但是在GRE、CFR這類高難度考試中,GPT-4的表現要強於Claude——因為它更像個會思考的人,而Claude更像是在闡述已知的客觀事實。

4.輸出內容豐富度

GPT-4早已擁有了過億的使用人群,但Claude2才剛剛發佈不久,這也就代表二者的資料庫內容豐富度相差甚遠,而AI的進步往往需要依靠大量的資料積累,這一點也就導致了GPT-4在輸出內容的豐富度上要遠超Claude。

 

Claude 2 怎麼註冊以及使用?

與其他聊天式機器人用法完全相同,首先當然要連到它的網站 https://claude.ai/ ,然後它會需要註冊,或是你可以直接透過 Google 帳號登入,首次登入後需要手機號碼驗證,之後就可以在下面的頁面中輸入問答。

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

不過,雖然目前他支援中文輸入,並且標榜說會有更高的正確性、比較不會有亂回答的現象,但是很不巧的,我們問了幾個問題,目前看來似乎不是這樣。像是下面這個,我們問的是「claude 2與 GPT-4 有何不同」,結果他直接把問題改成「GPT-2 與 GPT-4」有何不同。

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

再來問他什麼是「走鐘獎」,他直接把走鐘獎送到泰國去了。 Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

相較之下,Bing AI 的答覆就正確多了。

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

在 Claude 2 上傳 PDF、Word 檔案分析內容

做為示範,我們上交通部運輸所網站下載了一份PDF報告「現行國際疲勞駕駛監測科技資料蒐集彙整」 。

然後在 Claude 2 中點選迴紋針的圖示,就可以上傳這個檔案上去。上傳完畢後,你可以輸入你要問的問題就行了。

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

 接下來就會顯示答案。

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

如果你還有更多針對這個 PDF 檔案內的問題,可以在目前這個對話主題下面直接再輸入問題,不需要再上傳檔案。

Claude 2 中文上手實用懶人包:Claude 2是什麼、如何註冊?與GPT-4比起來如何?閱讀PDF好幫手

 

 

 

 

janus
作者

PC home雜誌、T客邦產業編輯,曾為多家科技雜誌撰寫專題文章,主要負責作業系統、軟體、電商、資安、A以及大數據、IT領域的取材以及報導,以及軟體相關教學報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則