20260426藍孝威/北京報導

DeepSeek-V4模型上線 功能僅次Gemini

號稱開源最強 支援華為昇騰晶片 推理知識力躍進 擁百萬字上下文

image
大陸AI企業深度求索24日正式發布全新系列大模型DeepSeek-V4預覽版本並同步開源。(新華社)

 大陸AI企業深度求索(DeepSeek)24日正式發布全新系列大模型DeepSeek-V4預覽版本並同步開源,立刻在全球科技圈投下震撼彈。根據深度求索發布的技術報告,DeepSeek-V4擁有百萬字超長上下文,在Agent能力、世界知識和推理性能上均實現大陸與開源領域的領先。路透指,其發展的水準,已僅次於谷歌頂尖閉源模型Gemini-Pro-3.1。

 深度求索24日在開源AI平台Hugging Face發布的技術報告顯示,DeepSeek-V4預覽版本包括兩個版本:DeepSeek-V4-Pro:1.6T總參數、49B激活參數,以及DeepSeek-V4-Flash:284B總參數、13B激活參數,兩者均支持100萬詞元(Token)的上下文長度。

 對此路透指出,DeepSeek-V4在世界知識測評中大幅領先其他開源模型,僅次於谷歌頂尖閉源模型,再次證明中國企業在AI領域「突飛猛進的技術實力」。更關鍵的是,華為昇騰等大陸國產算力已全面適配DeepSeek-V4,象徵中國正加速擺脫對美國尖端芯片的依賴。

 相較前代,DeepSeek-V4-Pro的Agent能力顯著增強,在Agentic Coding測評中已達「當前開源模型最佳水平」,使用體驗甚至優於閉源的Claude Sonnet 4.5,交付品質接近Claude Opus 4.6非思考模式。在世界知識測評中,DeepSeek-V4-Pro大幅領先其他開源模型,僅次於谷歌頂尖閉源模型Gemini-Pro-3.1。在數學、STEM、競賽型代碼測評中,更超越所有已公開評測的開源模型,取得「比肩世界頂級閉源模型」的優異成績。

 DeepSeek-V4-Flash則定位為「更快捷、高效的經濟之選」,世界知識儲備略遜一籌,但推理能力與Pro版接近。在簡單任務上與Pro版旗鼓相當,高難度任務仍有差距。

 DeepSeek一向以「低成本、高性能」聞名。根據《華爾街日報》報導,DeepSeek-V4在API價格上仍然具備壓倒性優勢,包括每100萬輸出詞元的價格為3.48美元,而美國Anthropic公司的閉源模型Claude Opus 4.6則為25美元。差距超過7倍。

 半島電視台評論指出,儘管美國在開發最先進模型方面略占優勢,但中國科技公司正「努力縮小與美國AI巨頭之間的技術差距」。不過,DeepSeek-V4的技術報告也坦承,在標準推理基準測試中的性能表現「略遜於Gemini-Pro-3.1等模型」,研發進度落後全球最頂尖的前沿模型約3到6個月。