AI Inference 起飛之後 · CPU 角色大洗牌,台廠 4 條鏈誰真的吃到肉
為什麼你該讀這篇?
過去兩年市場熱錢全壓在 GPU,CPU 被當成 AI server 的邊角料。
但我最近在追資料時注意到三件事一起發生:
- AWS Graviton(Arm 架構)已經佔 AWS 自家新部署 server 超過 50%,x86 在雲端的城牆破口越來越大
- NVIDIA Grace 把 CPU + GPU 用 NVLink 綁在同一塊主板上,CPU 不再是「插槽裡的配件」
- AI 從 Training 進入 Inference 階段,CPU 的角色從「不重要」變成「重要但長得不一樣」
這三件事疊起來,下一個 12 個月最被低估的不是 GPU,而是 CPU 旁邊的這幾條鏈。
這篇要回答你 4 個問題:
- AI Inference 為什麼讓 CPU 重新被需要?(Training vs Inference 結構性差異)
- x86 vs Arm 戰局走到哪了?(具體數字 + 三大雲端廠的選擇)
- NVIDIA Grace 對台廠的意義是什麼?(CPU+GPU 一體化的 BoM 變化)
- 台廠 4 條受惠鏈在哪?(ODM / 散熱 / 電源 / 載板)
一、AI Inference 為什麼讓 CPU 重新被需要?
過去兩年大家在意的是 Training(訓練模型)。Training 的 server 長相是這樣:
1 個機箱 = 8 顆 GPU + 1 顆 CPU + 大量 HBM
CPU 的工作只是「餵資料給 GPU」,幾乎不參與運算
所以 Training 時代,誰買 server 都選便宜夠用的 x86 CPU 就好,反正主角是 GPU。
Inference(推論,把訓練好的模型拿來服務用戶)的長相完全不同:
- 單次推論延遲(latency)很重要 —— 用戶點下去,3 秒回應 vs 0.3 秒回應,產品能不能用差超多
- 記憶體頻寬比算力重要 —— Inference 是一直把模型權重從記憶體搬到計算單元
- CPU 要協調更多任務 —— 不只是餵資料,還要管 batch、KV cache、用戶 session
換句話說:Training 階段 CPU 是「夠用就好」,Inference 階段 CPU 變成「會直接影響用戶體驗的瓶頸」。
當市場進入 Inference 主場(這件事 2025 下半年已經開始發生),整個 CPU 的選型邏輯會被重新洗一次。
二、x86 vs Arm 戰局走到哪了?
這是另一個很多人沒注意到的轉變。我整理了一下三大雲端廠(hyperscaler)的 Arm CPU 部署狀況:
AWS:自研 Graviton 已經切入主流
- AWS Graviton 系列從 2018 年第一代到現在第四代
- AWS 內部數據:新部署的 EC2 instance 超過 50% 使用 Graviton
- 客戶用 Graviton 比同等級 x86 便宜 20-40%、能耗低 60%
Google:Axion 加入戰場
- 2024 年發表第一代 Arm CPU「Axion」
- 主打 GCP 的 general-purpose 和 AI inference workload
- 已開放給 Snap、Spotify 等大客戶試跑
Microsoft:Cobalt 跟上
- 2024 年發表 Cobalt 100 Arm CPU
- 切入 Azure 自家服務(Teams、SQL Server)
- 跟 NVIDIA 合作把 Cobalt + Hopper GPU 包成 inference server
三大雲端廠都自研 Arm CPU 的訊號很清楚:他們不想被 Intel + AMD 卡脖子。
x86 陣營(Intel Xeon / AMD EPYC)當然會反擊,但「自研 Arm」這個趨勢一旦開始,回不去。市佔慢慢被啃,看的是時間。
三、NVIDIA Grace 對台廠的意義
NVIDIA 也選邊站了 —— 自己做 Arm CPU。
Grace CPU 的關鍵設計:
- 72 個 Arm Neoverse V2 核心
- 跟 Hopper / Blackwell GPU 透過 NVLink-C2C 連在同一塊主板上
- CPU + GPU 共享記憶體空間,省掉 PCIe 瓶頸
這對 server BoM 結構帶來幾個變化:
變化 1:「CPU 板」跟「GPU 板」不再分開
過去 server 設計是 CPU 主機板插 PCIe 接 GPU 加速卡。Grace 架構直接 CPU + GPU 焊在同一塊「Superchip 模組」上。
對台廠 ODM 來說,板子的設計、熱管理、電源供應全部要重新做。
變化 2:散熱密度暴衝
Grace + Blackwell 一個模組功耗 ~1,200W,下一代 Rubin Ultra 預期上看 5,000W 一個模組。風冷救不了,水冷是基本盤,浸沒式冷卻開始變主流選項。
變化 3:高階載板需求量爆發
Grace + GPU + HBM 全包在一個模組裡,需要的 ABF 載板層數高、面積大,台廠 ABF 廠的訂單能見度直接拉到 2027。
四、台廠 4 條受惠鏈拆解
把上面的結構性變化攤開,台廠 4 條鏈最有戲:
鏈 1:AI Server ODM(吃整個 Grace 系統訂單)
- 2382 廣達:NVIDIA GB200 NVL72 主要 ODM 之一,Grace + Blackwell 整機系統
- 6669 緯穎:hyperscaler 直供 ODM,Arm + x86 都做
- 3231 緯創:AI server 中游組裝
- 2317 鴻海(FII):拿到 NVIDIA AI server 大單,CSP 直供
為什麼重要:Grace 系統的單台 ASP 是傳統 server 的 5-10 倍,毛利率結構也會被重塑。
鏈 2:高熱密度散熱(從水冷走向浸沒式)
- 3017 奇鋐:3D VC 均熱片、液冷模組
- 3324 雙鴻:水冷 cold plate、CDU
- 6230 尼得科超眾:高功耗散熱解方
- 浸沒式冷卻新題材:相關液體冷卻劑 + 模組廠(這條還在卡位早期)
為什麼重要:5,000W 功耗等級的散熱解方台廠位置寡占,技術門檻高、報價有彈性。
鏈 3:高功率電源(一台機櫃 100kW 起跳)
- 2308 台達電:高效率電源(PSU + BBU)
- 3036 文曄:上游 power IC 通路
- 6803 崇越科技:power 設備代理
為什麼重要:機櫃功耗暴增直接推高電源 ASP 與技術門檻,台達是寡占龍頭。
鏈 4:高階 ABF 載板(CPU + GPU 一體化的關鍵零件)
- 3037 欣興:ABF 載板大廠
- 8046 南電:ABF 載板第二大
- 6213 聯茂:CCL 上游
為什麼重要:Grace + GPU + HBM 模組對載板層數、面積、技術規格的需求都升級,全球只有少數台廠能做。
五、3 個追蹤指標
如果你想把這條題材放進觀察清單,建議盯這 3 件事:
指標 1:NVIDIA 法說會的 Grace 出貨佔比
每季 NVIDIA 法說會會揭露 GB200 / GB300 NVL72 的出貨組合。如果 Grace 系統的佔比上升,整條 ODM + 散熱 + 載板鏈直接受惠。
指標 2:AWS / GCP / Azure 的 Arm CPU 採用率
Hyperscaler 的 Arm CPU 部署比例每季會更新。當這個數字突破 60% 是個重要訊號(代表 x86 在雲端的退守已經結構性發生)。
指標 3:台廠 ODM 的 AI server 營收佔比
廣達、緯穎、緯創每月營收會揭露 AI server 比重。當這個數字超過總營收 50%,估值結構會重新被法人定義。
六、個人觀察結論
我的看法是:過去兩年 GPU 是主角,下一年 GPU 仍然是主角,但 GPU 旁邊的 CPU 鏈會從「沒人看」變成「重新被定價」。
這不是 GPU 故事的反面,是 GPU 故事的延伸。
理解這個延伸,比追著 GPU 龍頭股殺進殺出重要得多。
七、怎麼追蹤這條題材
如果想系統化追這 4 條鏈,建議做兩件事:
- 建立追蹤清單:把上面提到的 10+ 檔放進清單,每月看一次月營收、每季看一次法說會。
- 配對其他 AI 鏈交叉看:CPU 鏈跟 GPU 鏈、HBM 鏈、光通訊鏈是同一個 AI 故事的四個面向,分開追會錯過 cross-read 訊號。
kunpao 的「追蹤清單 / 到價通知 / 週報 PDF」可以幫你把這幾條鏈自動排程,月營收 / 法說會 / 量價變化第一時間進到 Telegram。如果你需要把 AI server 整條鏈系統化追蹤,可以參考站上的訂閱方案。
本站所有內容只整理公開資訊與方法論,不構成任何投資建議。本文所引用數字皆為公開可查證之公司財報、雲端業者公開資料與業界常見估算,數字解讀為個人觀察。進出場決策請依照你自己的財務狀況與風險承受度判斷。