最新出刊

沒用輝達晶片!矽谷都在注意的中國開源AI模型GLM-5.2有多厲害?

最近科技圈又有一款AI模型成為熱門話題,來自中國的GLM-5.2有多厲害?

AI-DeepSeek-Z.AI-zAI-Claude-ChatGPT-OpenAI-Fable-輝達-晶片-華為 圖片來源:z.AI
其他
  • 天下Web only

繼DeepSeek模型在美國引發轟動、帶崩一票美股科技龍頭好幾天以來,又有中國AI模型成為關注焦點。這款模型會威脅美國AI霸權地位嗎?

近日,矽谷的網路同溫層因中國新創z.AI推出的全新開源模型議論紛紛。這款名叫GLM 5.2的大語言模型,專為執行長代碼任務和AI代理工作流而生。

源自北京清大實驗室「智譜」的z.AI表示,GLM-5.2擁有100萬個Token的上下文窗,與Anthropic的Claude Opus 4.8和 OpenAI的GPT-5.5同個量級。

「@zai_org的GLM-5.2的強大程式設計能力真的讓我印象深刻,幾乎到震驚的地步,這改變了一切,」雲端開發平台Vercel執行長朗奇(Guillermo Rauch)在X寫道。

社群媒體上,投資人、新創創辦人、科技產業意見領袖紛紛驚嘆這款上週推出新模型的速度與能力。

曾擔任Meta、Google DeepMind和微軟副總裁的維洛索(Matt Velloso)也花了一整天在使用GLM-5.2。他表示,「這是第一個足以成為我日常主力工具的開源模型。一切都不一樣了。」

和DeepSeek一樣,GLM-5.2採用開源模式,任何人都可以下載、在自己的系統內部署運行,並依照需求進行修改。多數美國最先進的模型如OpenAI與Anthropic 的產品則屬於封閉式模型。

在封閉模型的模式下,使用者必須依賴服務供應商。這對供應商來說是有利的,因為他們能夠攫取更多價值。對於投入數十億美元建設AI基礎設施、面臨營收成長壓力的公司來說,這種模式十分重要。

廣告

如果有開源模型的表現與封閉模型相當,甚至更好,那麼它很可能迅速搶下更大的市占。

美國和中國近年一直在競爭AI主導權,華府試圖透過晶片出口限制與技術存取管制來維持領先優勢,中國企業則持續推出成本更低、能力不斷提升的開源模型。

Anthropic最近警告,中國正透過較寬鬆的晶片管制和蒸餾攻擊快速追趕美國。所謂蒸餾攻擊就是利用能力更強的大模型來訓練較小的「學生」模型。

Anthropic表示,美國及盟友仍有機會在最先進AI能力上維持12到24個月的領先優勢,但「鎖定優勢的時間窗口不一定會長期保持敞開」。

去年一月DeepSeek發布能與OpenAI o1媲美的低成本推理模型R1時,中國首次給矽谷敲了響亮的警鐘。當時,投資人開始質疑矽谷在AI領域的領先地位是否如表面般穩固。隨著GLM-5.2爆紅,投資人心中也再次浮現這個問題。

廣告

z.AI從2025年1月起就被列入美國實體清單(制裁黑名單)。上星期Anthropic頂尖模型Fable被美國禁用,市場愈發擔憂美國政府的管制政策,z.AI正好坐收漁翁之利,股價暴漲90%,創下歷史新高。

GLM 5.2有多強?

GLM 5.2的市場狂熱背後有真槍實彈的數據支持。

在專門評估AI代理完成數小時開放式技術專案能力(包括系統優化、大規模程式碼建構、應用機器學習研究)的FrontierSWE基準測試中,GLM-5.2拿到74.4分,直逼Claude Opus 4.8的75.1分,小幅超越GPT-5.5的72.6分。

在測試AI代理能否自主解決真實世界GitHub issue(以通過率計分)的SWE-bench Pro測試中,GLM-5.2獲得62.1分,勝過GPT-5.5的58.6分,更大幅拉開與前代模型GLM-5.1(58.4分)的差距。

品質的飛躍性提升,使GLM-5.2成為目前「人工智慧分析指數」(Artificial Analysis Intelligence Index)中表現最好的開源模型。OpenRouter的基準測試更把GLM-5.2與目前被禁用的Claude Fable 5歸在同一個量級。

廣告

用來達成這項壯舉的硬體配置,也很耐人尋味。GLM-5.2是全數採用華為昇騰晶片訓練出來的,整個流程中完全沒有輝達身影。Stability AI創辦人莫斯塔克(Emad Mostaque)估計GLM-5.2總訓練成本約為2500萬美元,其中80%用在後期訓練,與同業相比,這個價格可說是超級便宜。

GLM-5.2是擁有7440億參數的混合專家模型,配備貨真價實的100萬token上下文窗口,而且採用MIT授權條款,任何政府命令都無法直接切斷使用權限。

適合誰用、價格多便宜?

對開發者來說,這個上下文窗口從根本上改變了工作流程。過去需要切碎資料的整個儲存庫導覽、多檔案重構、長流程的AI代理工作流,現在都變成單次呼叫就能搞定的工作。在API定價方面,每百萬輸入token要1.40美元,輸出為4.40 美元,比起Claude Opus 4.8的輸入5美元、輸出25美元便宜非常多。「寫程式方案」起價約為每月18美元,可直接在Claude Code、Cline、Kilo Code以及大多數主流的AI代理環境直接運作。

廣告

本機部署在技術上也是可行的。Unsloth AI推出了2-bit GGUF量化版本,把模型從1.51TB壓縮到 238GB,同時保留約82%的準確度。但你還是需要256GB的統一記憶體,或是同等容量的RAM/VRAM組合,也就是說你需要一台頂配的M4 Ultra Mac Studio,或者是一台配備中階GPU、透過混合專家模型卸載技術共享 256GB系統記憶體的工作站。這雖然還是會花一大筆錢,但如果你真的很想在自己家裡運行,是買得到、跑得動的。

(資料來源:BI、decrypt)

你可能有興趣
#Shorts|光與鹽管理顧問創辦人陳淑芬:天下學習幫助我們的學員,更加進步和成長。
最新訊息
天下45週年訂閱優惠
訂閱天下雜誌電子報

天下雜誌當期內容的精華與延伸,每周三發送最具時效性的深度內容