20260304・郭羽倫／綜合報導

DeepSeek改攜手華為下載領跑全球

　路透引述消息人士報導，大陸人工智慧初創企業深度求索（DeepSeek）並未依照重大模型更新前的業界慣例，向美國晶片商展示其即將發布的旗艦模型以進行性能最佳化，而是向包括華為在內的大陸供應商開放了提前使用權。

　報導指，DeepSeek預計將推出下一次重大更新版本V4，而AI開發商通常會向輝達和AMD等領先晶片製造商分享重大模型的預發布版本，以確保其軟體在廣泛使用的硬體上高效運行。DeepSeek以往曾與輝達的技術人員密切合作。

　研究公司 Creative Strategies 執行長巴赫林（Ben Bajarin）表示：「對輝達和AMD在通用資料加速器方面的影響微乎其微，大多數企業並未運行DeepSeek，它更像是一個基準測試模型。」他補充說，新的AI程式編寫工具正將軟體在硬體上高效運行所需的時間，「從數月縮短至數週。」巴赫林認為，此舉可能是大陸政府更廣泛戰略的一部分，試圖讓美國硬體與模型在大陸處於不利地位。

　路透社日前引述美國政府高級官員報導，DeepSeek即將發布的新一代AI模型，使用了輝達最先進的Blackwell晶片進行訓練，此舉可能違反美國的出口管制規定。

　根據該名美國官員說法，DeepSeek可能會試圖移除顯示其使用美國AI晶片的技術指標，並計畫對外聲稱其模型是使用華為的晶片訓練。他補充說，這些Blackwell晶片很可能集中部署於其位於大陸內蒙古的數據中心。

　該官員還指出，DeepSeek用於訓練最新模型的過程，很可能採用了來自美國先進AI公司的「蒸餾」技術，包括利用 Anthropic、Google、OpenAI等的AI模型。

　報導提到，自DeepSeek於2025年1月橫空出世以來，其模型在開源平台Hugging Face上的下載量已超過7500萬次，推動了大陸開源模型浪潮，並與美國AI實驗室展開競爭。在過去一年發布的模型中，大陸模型的下載量超過了該平台上其他任何國家的模型。（更多精彩內容請免費下載《翻爆》APP）

DeepSeek改攜手華為 下載領跑全球

訊息提示

DeepSeek改攜手華為下載領跑全球