AI Inference 起飛之後 · CPU 角色大洗牌，台廠 4 條鏈誰真的吃到肉

為什麼你該讀這篇？

過去兩年市場熱錢全壓在 GPU，CPU 被當成 AI server 的邊角料。

但我最近在追資料時注意到三件事一起發生：

AWS Graviton（Arm 架構）已經佔 AWS 自家新部署 server 超過 50%，x86 在雲端的城牆破口越來越大
NVIDIA Grace 把 CPU + GPU 用 NVLink 綁在同一塊主板上，CPU 不再是「插槽裡的配件」
AI 從 Training 進入 Inference 階段，CPU 的角色從「不重要」變成「重要但長得不一樣」

這三件事疊起來，下一個 12 個月最被低估的不是 GPU，而是 CPU 旁邊的這幾條鏈。

這篇要回答你 4 個問題：

AI Inference 為什麼讓 CPU 重新被需要？（Training vs Inference 結構性差異）
x86 vs Arm 戰局走到哪了？（具體數字 + 三大雲端廠的選擇）
NVIDIA Grace 對台廠的意義是什麼？（CPU+GPU 一體化的 BoM 變化）
台廠 4 條受惠鏈在哪？（ODM / 散熱 / 電源 / 載板）

一、AI Inference 為什麼讓 CPU 重新被需要？

過去兩年大家在意的是 Training（訓練模型）。Training 的 server 長相是這樣：

1 個機箱 = 8 顆 GPU + 1 顆 CPU + 大量 HBM
CPU 的工作只是「餵資料給 GPU」，幾乎不參與運算

所以 Training 時代，誰買 server 都選便宜夠用的 x86 CPU 就好，反正主角是 GPU。

Inference（推論，把訓練好的模型拿來服務用戶）的長相完全不同：

單次推論延遲（latency）很重要 —— 用戶點下去，3 秒回應 vs 0.3 秒回應，產品能不能用差超多
記憶體頻寬比算力重要 —— Inference 是一直把模型權重從記憶體搬到計算單元
CPU 要協調更多任務 —— 不只是餵資料，還要管 batch、KV cache、用戶 session

換句話說：Training 階段 CPU 是「夠用就好」，Inference 階段 CPU 變成「會直接影響用戶體驗的瓶頸」。

當市場進入 Inference 主場（這件事 2025 下半年已經開始發生），整個 CPU 的選型邏輯會被重新洗一次。

二、x86 vs Arm 戰局走到哪了？

這是另一個很多人沒注意到的轉變。我整理了一下三大雲端廠（hyperscaler）的 Arm CPU 部署狀況：

AWS：自研 Graviton 已經切入主流

AWS Graviton 系列從 2018 年第一代到現在第四代
AWS 內部數據：新部署的 EC2 instance 超過 50% 使用 Graviton
客戶用 Graviton 比同等級 x86 便宜 20-40%、能耗低 60%

Google：Axion 加入戰場

2024 年發表第一代 Arm CPU「Axion」
主打 GCP 的 general-purpose 和 AI inference workload
已開放給 Snap、Spotify 等大客戶試跑

Microsoft：Cobalt 跟上

2024 年發表 Cobalt 100 Arm CPU
切入 Azure 自家服務（Teams、SQL Server）
跟 NVIDIA 合作把 Cobalt + Hopper GPU 包成 inference server

三大雲端廠都自研 Arm CPU 的訊號很清楚：他們不想被 Intel + AMD 卡脖子。

x86 陣營（Intel Xeon / AMD EPYC）當然會反擊，但「自研 Arm」這個趨勢一旦開始，回不去。市佔慢慢被啃，看的是時間。

三、NVIDIA Grace 對台廠的意義

NVIDIA 也選邊站了 —— 自己做 Arm CPU。

Grace CPU 的關鍵設計：

72 個 Arm Neoverse V2 核心
跟 Hopper / Blackwell GPU 透過 NVLink-C2C 連在同一塊主板上
CPU + GPU 共享記憶體空間，省掉 PCIe 瓶頸

這對 server BoM 結構帶來幾個變化：

變化 1：「CPU 板」跟「GPU 板」不再分開

過去 server 設計是 CPU 主機板插 PCIe 接 GPU 加速卡。Grace 架構直接 CPU + GPU 焊在同一塊「Superchip 模組」上。

對台廠 ODM 來說，板子的設計、熱管理、電源供應全部要重新做。

變化 2：散熱密度暴衝

Grace + Blackwell 一個模組功耗 ~1,200W，下一代 Rubin Ultra 預期上看 5,000W 一個模組。風冷救不了，水冷是基本盤，浸沒式冷卻開始變主流選項。

變化 3：高階載板需求量爆發

Grace + GPU + HBM 全包在一個模組裡，需要的 ABF 載板層數高、面積大，台廠 ABF 廠的訂單能見度直接拉到 2027。

四、台廠 4 條受惠鏈拆解

把上面的結構性變化攤開，台廠 4 條鏈最有戲：

鏈 1：AI Server ODM（吃整個 Grace 系統訂單）

2382 廣達：NVIDIA GB200 NVL72 主要 ODM 之一，Grace + Blackwell 整機系統
6669 緯穎：hyperscaler 直供 ODM，Arm + x86 都做
3231 緯創：AI server 中游組裝
2317 鴻海（FII）：拿到 NVIDIA AI server 大單，CSP 直供

為什麼重要：Grace 系統的單台 ASP 是傳統 server 的 5-10 倍，毛利率結構也會被重塑。

鏈 2：高熱密度散熱（從水冷走向浸沒式）

3017 奇鋐：3D VC 均熱片、液冷模組
3324 雙鴻：水冷 cold plate、CDU
6230 尼得科超眾：高功耗散熱解方
浸沒式冷卻新題材：相關液體冷卻劑 + 模組廠（這條還在卡位早期）

為什麼重要：5,000W 功耗等級的散熱解方台廠位置寡占，技術門檻高、報價有彈性。

鏈 3：高功率電源（一台機櫃 100kW 起跳）

2308 台達電：高效率電源（PSU + BBU）
3036 文曄：上游 power IC 通路
6803 崇越科技：power 設備代理

為什麼重要：機櫃功耗暴增直接推高電源 ASP 與技術門檻，台達是寡占龍頭。

鏈 4：高階 ABF 載板（CPU + GPU 一體化的關鍵零件）

3037 欣興：ABF 載板大廠
8046 南電：ABF 載板第二大
6213 聯茂：CCL 上游

為什麼重要：Grace + GPU + HBM 模組對載板層數、面積、技術規格的需求都升級，全球只有少數台廠能做。

五、3 個追蹤指標

如果你想把這條題材放進觀察清單，建議盯這 3 件事：

指標 1：NVIDIA 法說會的 Grace 出貨佔比

每季 NVIDIA 法說會會揭露 GB200 / GB300 NVL72 的出貨組合。如果 Grace 系統的佔比上升，整條 ODM + 散熱 + 載板鏈直接受惠。

指標 2：AWS / GCP / Azure 的 Arm CPU 採用率

Hyperscaler 的 Arm CPU 部署比例每季會更新。當這個數字突破 60% 是個重要訊號（代表 x86 在雲端的退守已經結構性發生）。

指標 3：台廠 ODM 的 AI server 營收佔比

廣達、緯穎、緯創每月營收會揭露 AI server 比重。當這個數字超過總營收 50%，估值結構會重新被法人定義。

六、個人觀察結論

我的看法是：過去兩年 GPU 是主角，下一年 GPU 仍然是主角，但 GPU 旁邊的 CPU 鏈會從「沒人看」變成「重新被定價」。

這不是 GPU 故事的反面，是 GPU 故事的延伸。

理解這個延伸，比追著 GPU 龍頭股殺進殺出重要得多。

七、怎麼追蹤這條題材

如果想系統化追這 4 條鏈，建議做兩件事：

建立追蹤清單：把上面提到的 10+ 檔放進清單，每月看一次月營收、每季看一次法說會。
配對其他 AI 鏈交叉看：CPU 鏈跟 GPU 鏈、HBM 鏈、光通訊鏈是同一個 AI 故事的四個面向，分開追會錯過 cross-read 訊號。

kunpao 的「追蹤清單 / 到價通知 / 週報 PDF」可以幫你把這幾條鏈自動排程，月營收 / 法說會 / 量價變化第一時間進到 Telegram。如果你需要把 AI server 整條鏈系統化追蹤，可以參考站上的訂閱方案。

本站所有內容只整理公開資訊與方法論，不構成任何投資建議。本文所引用數字皆為公開可查證之公司財報、雲端業者公開資料與業界常見估算，數字解讀為個人觀察。進出場決策請依照你自己的財務狀況與風險承受度判斷。

AI Inference 起飛之後 · CPU 角色大洗牌，台廠 4 條鏈誰真的吃到肉

AI Inference 起飛之後 · CPU 角色大洗牌，台廠 4 條鏈誰真的吃到肉

為什麼你該讀這篇？

一、AI Inference 為什麼讓 CPU 重新被需要？

二、x86 vs Arm 戰局走到哪了？

AWS：自研 Graviton 已經切入主流

Google：Axion 加入戰場

Microsoft：Cobalt 跟上

三、NVIDIA Grace 對台廠的意義

變化 1：「CPU 板」跟「GPU 板」不再分開

變化 2：散熱密度暴衝

變化 3：高階載板需求量爆發

四、台廠 4 條受惠鏈拆解

鏈 1：AI Server ODM（吃整個 Grace 系統訂單）

鏈 2：高熱密度散熱（從水冷走向浸沒式）

鏈 3：高功率電源（一台機櫃 100kW 起跳）

鏈 4：高階 ABF 載板（CPU + GPU 一體化的關鍵零件）

五、3 個追蹤指標

指標 1：NVIDIA 法說會的 Grace 出貨佔比

指標 2：AWS / GCP / Azure 的 Arm CPU 採用率

指標 3：台廠 ODM 的 AI server 營收佔比

六、個人觀察結論

七、怎麼追蹤這條題材

📌 想看對應的實盤追蹤？

延伸閱讀