2025.03.25 14:00

DeepSeek-V3 更新:程式碼能力直逼 Claude Sonnet 3.5,開源協定更寬鬆

ADVERTISEMENT

 中國人工智慧領域的後起之秀 DeepSeek 近日投下震撼彈,不僅悄然釋出了新一代 DeepSeek-V3 模型,更同步宣布將其開源協議升級至與其旗艦模型 DeepSeek-R1 相同的 MIT 授權。這項策略性的舉動,無疑展現了 DeepSeek 深耕開源生態、吸引全球開發者社群的雄心壯志,也預示著其在通用人工智慧(AGI)領域的佈局將更加積極。

DeepSeek 自成立以來,便以其在深度學習和自然語言處理方面的技術實力受到業界矚目。其先前推出的 DeepSeek-R1 模型,憑藉卓越的性能和相對親民的價格,在開源社群中獲得了廣泛的認可。此次 DeepSeek-V3 的更新,版本為DeepSeek-V3-0324,官方定位為小版本更新,並非市場先前一直期待的DeepSeek-V4或R2。但從網友回饋和實際測試結果來看,其在核心能力上的提升幅度卻遠超預期,尤其是在程式碼生成和數學推理方面,展現出了足以挑戰業界領先者的實力。

ADVERTISEMENT

開源策略再進化:擁抱 MIT 協議,釋放開發潛能

本次 DeepSeek-V3 最引人關注的變革之一,便是其開源協議的升級。MIT 協議以其寬鬆的授權條款聞名,允許網友在遵守著作權和許可聲明的前提下,自由地使用、複製、修改、合併、發布、再授權和/或銷售軟體的副本。相較於其他可能限制商業應用的開源協議,MIT 協議無疑為開發者提供了更大的彈性和自由度,極大地降低了使用門檻。

DeepSeek 選擇將其主流模型 DeepSeek-V3 也納入 MIT 協議之下,無疑是希望藉此吸引更多全球的開發者參與到模型的應用開發和生態建設中來。透過開源的力量,DeepSeek 不僅能夠加速模型的迭代和完善,更能激發出更多創新的應用場景,進一步擴大其在人工智慧領域的影響力。對於台灣的眾多新創團隊和研究機構而言,這也意味著可以更便捷地獲取和利用 DeepSeek 的先進技術,加速自身產品和服務的創新。

ADVERTISEMENT

程式碼能力突飛猛進:直逼 Claude Sonnet 3.5,網頁開發展現驚人效率

新版 DeepSeek-V3 上線後,最令網友驚豔的莫過於其在程式碼生成方面的卓越表現。多位實際測試過的網友指出,新版模型在程式碼的品質、效率以及複雜度上都有了顯著的提升。甚至有網友表示,DeepSeek-V3 終於能夠在程式碼領域與 Anthropic 的 Claude Sonnet 3.5 相提並論。

Claude Sonnet 3.5 作為 Anthropic 旗下備受推崇的模型,一直以來在程式設計師社群中擁有極高的聲譽,其在程式碼的理解、生成和除錯方面的能力都堪稱一流。如今,DeepSeek-V3 能夠獲得與之比肩的評價,足以證明其在程式碼能力上的巨大進步。

Aider已經更新了榜單:Aider LLM Leaderboards

ADVERTISEMENT

DeepSeek-V3-0324在榜單上排第7位,價格遠低於所有其他上榜大模型,是claude 3.7的三十分之一,o1的百分之一,甚至是自家DeepSeek-R1的五分之一。

為了更具體地展現 DeepSeek-V3 在程式碼方面的實力,有中國網友進行了一項有趣的測試:要求模型設計一個具有科技感的個人部落格網站,並直接生成可用的網頁程式碼。令人驚訝的是,DeepSeek-V3 在短短兩分鐘內就交付了一個包含 400 多行程式碼、設計精良的完整網站。

ADVERTISEMENT

這個由 DeepSeek-V3 生成的部落格網站,不僅在視覺上呈現出濃厚的科技感,更融入了多項現代網頁設計的流行元素。網站的背景採用了動態的粒子動畫,營造出深邃而引人入勝的視覺效果。網友介面(UI)的設計則充滿了賽博龐克風格,運用了霓虹燈光效、懸浮動畫以及充滿未來感的配色方案,讓整個網站充滿了前衛的氣息。

更令人稱道的是,網站的標題部分還加入了時下流行的打字機動畫效果,文字逐一顯現,增添了互動性和趣味性。網站上的按鈕也設計了光波擴散的視覺回饋,當滑鼠懸停或點擊時,會產生流動的光效,提升了網友的操作體驗。此外,DeepSeek-V3 生成的網站還具備自適應設計,能夠根據網友瀏覽設備的螢幕尺寸自動調整佈局和元素大小,無論是在手機、平板還是桌上型電腦上都能呈現出最佳的視覺效果。

相較之下,舊版的 DeepSeek-V3 在面對相同的指令時,僅能生成約 100 多行的程式碼,且輸出的網站在美觀度和功能性上都明顯遜色不少。新版 DeepSeek-V3 在網頁開發方面的驚人效率和高品質的輸出,無疑將為前端開發人員帶來巨大的便利,未來或許能成為開發流程中不可或缺的得力助手。

數學能力顯著提升:展現反思與修正能力,更趨近人類思維

除了程式碼能力的大幅提升外,新版 DeepSeek-V3 在數學方面的表現也同樣令人驚艷。許多網友在測試後紛紛表示,這次的「小更新」在數學能力上的改進程度遠超他們的預期。

一位網友分享了一個有趣的案例:他使用了一道曾經成功難倒舊版 DeepSeek-V3 和 DeepSeek-R1 的數學題來測試新版模型。雖然新版 DeepSeek-V3 最終仍然未能給出完全正確的答案,但其在解題過程中展現出了一些令人鼓舞的新變化。

6.9和6.11哪個大?

要比較(6.9) 和(6.11) 的大小,可以按照以下步驟進行:
統一小數位數:
為了方便比較,將兩個數的小數位數統一。將(6.9) 寫成(6.90)。
[
6.9 = 6.90
]
逐位比較:
整數部分:兩數的整數部分都是(6),相同。
十分位:比較(6.90) 和(6.11) 的十分位數字:
(6.90) 的十分位是(9)。
(6.11) 的十分位是(1)。
(9 > 1),因此(6.90 > 6.11)。
結論:
[
boxed{6.9 > 6.11}
]

與以往不同的是,新版 DeepSeek-V3 在給出最終答案後,會進行一定程度的反思,並嘗試修改自己的解題過程。這種反思和修正的能力,是過去的模型所不具備的,它更趨近於人類在解決複雜問題時的思考方式。雖然這次的嘗試並未完全成功,但這也預示著 DeepSeek 在提升模型推理能力方面取得了重要的進展。

數學能力對於通用人工智慧的發展至關重要。無論是在科學研究、工程設計還是金融分析等領域,都需要強大的數學推理能力作為支撐。DeepSeek-V3 在數學方面的提升,無疑將擴展其在更廣泛領域的應用潛力。

通用知識與推理能力增強:答案更全面,更擅長長輸出

新版 DeepSeek-V3 的提升不僅限於程式碼和數學領域,其在通用知識和推理能力方面也展現出了顯著的進步。網友發現,新版模型在回答文科類問題時,能夠提供更為全面和深入的答案。

此外,網友還觀察到,新版 DeepSeek-V3 更傾向於使用較長的輸出來解決問題。這或許是因為 DeepSeek 在訓練過程中,更加注重讓模型提供詳盡的解釋和論證,從而提升答案的品質和可信度。這種傾向於長輸出的特性,也使得新版 DeepSeek-V3 在處理需要深入分析和解釋的複雜問題時更具優勢。

部分網友將新版 DeepSeek-V3 形容為舊版 V3 和 R1 的結合體,它似乎繼承了 V3 在程式碼生成方面的效率和 R1 在通用知識理解方面的深度,並在此基礎上進行了全面的提升。

展望未來:DeepSeek-R2 與 V4 引人期待

DeepSeek-V3 的本次重大更新,無疑為整個 AI 社群注入了一股新的活力。其在程式碼、數學和通用知識等核心能力上的顯著提升,以及更開放的 MIT 開源協議,都預示著 DeepSeek 在人工智慧領域的發展前景一片光明。

在 DeepSeek-V3 展現出如此強大的潛力之後,許多人也開始更加期待 DeepSeek 未來將會推出的 DeepSeek-R2 和 V4 模型。我們有理由相信,在持續的技術投入和不斷的創新之下,DeepSeek 將會在 AI 工具賽道上佔據越來越重要的地位,並為全球的開發者和網友帶來更多令人興豔的 AI 應用。

總結而言,DeepSeek-V3 的本次更新是一次具有里程碑意義的升級。它不僅在關鍵技術能力上取得了顯著的突破,更在開源策略上展現出了更為積極和開放的姿態。對於台灣的科技產業而言,這是一個值得關注的重要發展趨勢,或許能為我們帶來更多合作和創新的機會。

 

 

ADVERTISEMENT