- 天下Web only
接近1年前,DeepSeek讓整個AI業界天搖地動。
當時部分西方科技龍頭的股價斷崖式暴跌,市場進入恐慌模式,擔心這家原本沒沒無聞的中國新創彎道超車,挑戰美國在AI領域的領導優勢和霸權地位。
那斯達克單日崩3%,輝達(Nvidia)跳水17%,市值蒸發接近6000億美元,博通(Broadcom)、艾司摩爾(ASML)單日分別重挫17%和7%。
11個月過去了,這些公司沒有再下跌,還一路上漲。輝達去年10月成為第1家市值5兆美元的公司,博通整個2025年上漲49%,艾司摩爾也上揚36%。
顧問公司顧能(Gartner)資深主任分析師坎達巴圖(Haritha Khandabattu)告訴《CNBC》,「DeepSeek在1月造成了廣泛而顯著的價格重估,因為它改變了全球市場對於前沿模型成本曲線和中國競爭力的認知,直接衝擊半導體和科技巨頭的成長敘事。」
在那之後,DeepSeek推出7款新AI模型,沒有1款能夠引發像1月那樣的劇烈波瀾。市場為什麼對DeepSeek的新模型沒反應?
欠缺震撼因素
2023年創辦的DeepSeek,在2024年底釋出免費、開源的大型語言模型(LLM)「V3」,號稱使用的晶片效能和算力成本遠低於OpenAI和Google的大型語言模型。
幾個星期後,在2025年的1月,DeepSeek公開推理模型R1,表現媲美甚至超越許多全球一流的大型語言模型。
投資公司D.A. Davidson資深分析師普拉特(Alex Platt)告訴《CNBC》,DeepSeek在1月公開的模型「確實讓市場非常驚訝」,當時市場普遍認為中國落後美國9到12個月。
晨星(Morningstar)資深股票分析師科雷洛(Brian Colello)說,市場擔心若使用比較少算力就能得出跟最先進系統差不多的成果,就會衝擊AI基礎建設的需求,重創輝達等公司的營收。
「結果恰恰相反,2025年的支出沒有減緩,展望未來,還可以預見2026年以後的支出加速。」
此外,DeepSeek從1月以來推出的所有模型都是V3和R1的更新版,而不是全新的模型。
DeepSeek最新兩款模型能媲美GPT-5和Gemini 3 Pro的推理表現。不過坎達布圖指出,市場只把DeepSeek新模型看成「舊模型的延續和鞏固,而不是全新的震撼波」。
算力卡脖子
分析師告訴《CNBC》,DeepSeek沒公布全新模型的部分原因,可能是算力有限。
普拉特說,「算力一直是一大瓶頸」。
「演算法研究和架構獨創性能做到的終究有限。」
《金融時報》8月報導,DeepSeek延後推出原定5月上架的R2模型,就是因為用華為晶片訓練模型遭遇很多挑戰。
根據《金融時報》,由於輝達部分最強晶片面臨出口管制,中國政府鼓勵DeepSeek使用國產處理器,降低對美國產品的依賴。
《晶片戰爭》作者米勒(Chris Miller)告訴《CNBC》,「過去幾年,中國能夠獲取的算力一直受限,這很大一部分是因為美國限制晶片出售。」
「如果想要打造先進模型,就需要先進的算力。」
DeepSeek在1月初的研究論文中承認,「和Gemini 3等前沿閉源模型相比,我們受到特定限制,包括算力資源。」
去年8月,OpenAI公布GPT-5,Anthropic公布Claude Opus 4.5,Google在11月推出Gemini 3。
顧能分析師詹德拉瑟卡蘭(Arun Chandrasekaran)告訴《CNBC》,「這些供應者之間的競爭非常激烈,推出新模型的速度極快,效能也逐漸進步。」結果就是市場不再那麼恐懼AI模型一夕之間商品化,衝擊產業價值。
但有跡象顯示,DeepSeek蓄勢待發,準備未來幾個月盛大推出新模型。DeepSeek在元旦發布一篇論文,詳細描述開發AI模型的更高效方法。
Wedbush證券分析師艾維斯(Dan Ives)認為,可能有更多震撼等著市場,「我們見證過的這些震撼時刻,明年還會繼續發生。」
「還會有下一個DeepSeek。」
(資料來源:CNBC、Financial Times)
天下總主筆陳良榕專欄。半導體狂熱、科技巨頭謀略的最犀利解讀
看懂科技大勢,獨家解讀
請查看您的信箱,我們將寄送驗證信給您,確保未來信件會送到您的信箱