- 天下Web only
繼DeepSeek模型在美國引發轟動、帶崩一票美股科技龍頭好幾天以來,又有中國AI模型成為關注焦點。這款模型會威脅美國AI霸權地位嗎?
近日,矽谷的網路同溫層因中國新創z.AI推出的全新開源模型議論紛紛。這款名叫GLM 5.2的大語言模型,專為執行長代碼任務和AI代理工作流而生。
源自北京清大實驗室「智譜」的z.AI表示,GLM-5.2擁有100萬個Token的上下文窗,與Anthropic的Claude Opus 4.8和 OpenAI的GPT-5.5同個量級。
「@zai_org的GLM-5.2的強大程式設計能力真的讓我印象深刻,幾乎到震驚的地步,這改變了一切,」雲端開發平台Vercel執行長朗奇(Guillermo Rauch)在X寫道。
社群媒體上,投資人、新創創辦人、科技產業意見領袖紛紛驚嘆這款上週推出新模型的速度與能力。
曾擔任Meta、Google DeepMind和微軟副總裁的維洛索(Matt Velloso)也花了一整天在使用GLM-5.2。他表示,「這是第一個足以成為我日常主力工具的開源模型。一切都不一樣了。」
和DeepSeek一樣,GLM-5.2採用開源模式,任何人都可以下載、在自己的系統內部署運行,並依照需求進行修改。多數美國最先進的模型如OpenAI與Anthropic 的產品則屬於封閉式模型。
在封閉模型的模式下,使用者必須依賴服務供應商。這對供應商來說是有利的,因為他們能夠攫取更多價值。對於投入數十億美元建設AI基礎設施、面臨營收成長壓力的公司來說,這種模式十分重要。
如果有開源模型的表現與封閉模型相當,甚至更好,那麼它很可能迅速搶下更大的市占。
美國和中國近年一直在競爭AI主導權,華府試圖透過晶片出口限制與技術存取管制來維持領先優勢,中國企業則持續推出成本更低、能力不斷提升的開源模型。
Anthropic最近警告,中國正透過較寬鬆的晶片管制和蒸餾攻擊快速追趕美國。所謂蒸餾攻擊就是利用能力更強的大模型來訓練較小的「學生」模型。
Anthropic表示,美國及盟友仍有機會在最先進AI能力上維持12到24個月的領先優勢,但「鎖定優勢的時間窗口不一定會長期保持敞開」。
去年一月DeepSeek發布能與OpenAI o1媲美的低成本推理模型R1時,中國首次給矽谷敲了響亮的警鐘。當時,投資人開始質疑矽谷在AI領域的領先地位是否如表面般穩固。隨著GLM-5.2爆紅,投資人心中也再次浮現這個問題。
z.AI從2025年1月起就被列入美國實體清單(制裁黑名單)。上星期Anthropic頂尖模型Fable被美國禁用,市場愈發擔憂美國政府的管制政策,z.AI正好坐收漁翁之利,股價暴漲90%,創下歷史新高。
GLM 5.2有多強?
GLM 5.2的市場狂熱背後有真槍實彈的數據支持。
在專門評估AI代理完成數小時開放式技術專案能力(包括系統優化、大規模程式碼建構、應用機器學習研究)的FrontierSWE基準測試中,GLM-5.2拿到74.4分,直逼Claude Opus 4.8的75.1分,小幅超越GPT-5.5的72.6分。
在測試AI代理能否自主解決真實世界GitHub issue(以通過率計分)的SWE-bench Pro測試中,GLM-5.2獲得62.1分,勝過GPT-5.5的58.6分,更大幅拉開與前代模型GLM-5.1(58.4分)的差距。
品質的飛躍性提升,使GLM-5.2成為目前「人工智慧分析指數」(Artificial Analysis Intelligence Index)中表現最好的開源模型。OpenRouter的基準測試更把GLM-5.2與目前被禁用的Claude Fable 5歸在同一個量級。
用來達成這項壯舉的硬體配置,也很耐人尋味。GLM-5.2是全數採用華為昇騰晶片訓練出來的,整個流程中完全沒有輝達身影。Stability AI創辦人莫斯塔克(Emad Mostaque)估計GLM-5.2總訓練成本約為2500萬美元,其中80%用在後期訓練,與同業相比,這個價格可說是超級便宜。
GLM-5.2是擁有7440億參數的混合專家模型,配備貨真價實的100萬token上下文窗口,而且採用MIT授權條款,任何政府命令都無法直接切斷使用權限。
適合誰用、價格多便宜?
對開發者來說,這個上下文窗口從根本上改變了工作流程。過去需要切碎資料的整個儲存庫導覽、多檔案重構、長流程的AI代理工作流,現在都變成單次呼叫就能搞定的工作。在API定價方面,每百萬輸入token要1.40美元,輸出為4.40 美元,比起Claude Opus 4.8的輸入5美元、輸出25美元便宜非常多。「寫程式方案」起價約為每月18美元,可直接在Claude Code、Cline、Kilo Code以及大多數主流的AI代理環境直接運作。
本機部署在技術上也是可行的。Unsloth AI推出了2-bit GGUF量化版本,把模型從1.51TB壓縮到 238GB,同時保留約82%的準確度。但你還是需要256GB的統一記憶體,或是同等容量的RAM/VRAM組合,也就是說你需要一台頂配的M4 Ultra Mac Studio,或者是一台配備中階GPU、透過混合專家模型卸載技術共享 256GB系統記憶體的工作站。這雖然還是會花一大筆錢,但如果你真的很想在自己家裡運行,是買得到、跑得動的。
(資料來源:BI、decrypt)
天下總主筆陳良榕專欄。半導體狂熱、科技巨頭謀略的最犀利解讀
看懂科技大勢,獨家解讀
請查看您的信箱,我們將寄送驗證信給您,確保未來信件會送到您的信箱