20260304郭羽倫/綜合報導

DeepSeek改攜手華為 下載領跑全球

image
熱門話題

 路透引述消息人士報導,大陸人工智慧初創企業深度求索(DeepSeek)並未依照重大模型更新前的業界慣例,向美國晶片商展示其即將發布的旗艦模型以進行性能最佳化,而是向包括華為在內的大陸供應商開放了提前使用權。

 報導指,DeepSeek預計將推出下一次重大更新版本V4,而AI開發商通常會向輝達和AMD等領先晶片製造商分享重大模型的預發布版本,以確保其軟體在廣泛使用的硬體上高效運行。DeepSeek以往曾與輝達的技術人員密切合作。

 研究公司 Creative Strategies 執行長巴赫林(Ben Bajarin)表示:「對輝達和AMD在通用資料加速器方面的影響微乎其微,大多數企業並未運行DeepSeek,它更像是一個基準測試模型。」他補充說,新的AI程式編寫工具正將軟體在硬體上高效運行所需的時間,「從數月縮短至數週。」巴赫林認為,此舉可能是大陸政府更廣泛戰略的一部分,試圖讓美國硬體與模型在大陸處於不利地位。

 路透社日前引述美國政府高級官員報導,DeepSeek即將發布的新一代AI模型,使用了輝達最先進的Blackwell晶片進行訓練,此舉可能違反美國的出口管制規定。

 根據該名美國官員說法,DeepSeek可能會試圖移除顯示其使用美國AI晶片的技術指標,並計畫對外聲稱其模型是使用華為的晶片訓練。他補充說,這些Blackwell晶片很可能集中部署於其位於大陸內蒙古的數據中心。

 該官員還指出,DeepSeek用於訓練最新模型的過程,很可能採用了來自美國先進AI公司的「蒸餾」技術,包括利用 Anthropic、Google、OpenAI等的AI模型。

 報導提到,自DeepSeek於2025年1月橫空出世以來,其模型在開源平台Hugging Face上的下載量已超過7500萬次,推動了大陸開源模型浪潮,並與美國AI實驗室展開競爭。在過去一年發布的模型中,大陸模型的下載量超過了該平台上其他任何國家的模型。(更多精彩內容請免費下載《翻爆》APP)