
在資料被譽為「新石油」的數位時代,「Tokens」正成為驅動資訊檢索與生成的核心貨幣。透過「Tokenization」過程,原始資料被轉化為結構化資訊,成為訓練與驅動AI模型的燃料。然而,這一轉化過程高度依賴龐大的運算資源與能源效率。隨著AI模型複雜度與精確度需求飆升,運算資源的應用已形成三大關鍵階段:預訓練、後訓練與推理拓展。在此背景下,NVIDIA於2025年GTC大會上提出「AI工廠」願景,試圖透過全端式(Full Stack)技術革新,重新定義AI基礎設施的未來。
AI工廠:從願景到實踐的運算革命
NVIDIA執行長黃仁勳(Jensen Huang)在GTC大會中強調,AI工廠將成為企業IT、雲端運算與機器人產業的下一代基礎設施,其核心目標是將分散的AI運算資源整合為高效、可擴展的生產力引擎。為實現這一目標,NVIDIA從矽晶、系統到軟體層面,展開全方位技術布局。
- 矽晶創新:從光速運算到能源效率突破
在硬體層面,NVIDIA公布多項技術藍圖,包括:
- Blackwell Ultra平台:GB300 NVL72相較前代GB200性能提升1.5倍,成為AI工廠的運算骨幹。
- 未來架構規劃:從Blackwell、Hopper到Rubin與Feynman架構,NVIDIA以兩年為週期推進製程,其中Rubin Ultra採用四晶片設計,提供100PF的FP4運算能力,並搭載1TB HBM4e記憶體,預計2027年問世。
- 光子技術整合:全新Spectrum-X光子交換器透過台積電3D堆疊技術,降低能耗並支持數百萬GPU規模部署,為超大型AI工廠鋪路。
Counterpoint Research分析指出,NVIDIA的矽晶技術不僅鞏固其AI運算領導地位,更可能使其成為台積電最大客戶,進一步壓縮競爭對手的技術追趕空間。
- 系統整合:從超級叢集到個人化AI工作站
為滿足不同場景需求,NVIDIA推出多層級系統方案:
- DGX SuperPOD GB300:整合72個Blackwell Ultra GPU與36個Grace CPU,AI推理性能較Hopper系統躍升70倍,並透過NVLink實現跨GPU記憶體共享,突破傳統叢集瓶頸。
- Blackwell RTX Pro:針對科研與設計領域,強化AI視覺化與物理模擬能力,推動工業數位孿生應用。
- DGX Spark:與聯發科合作開發的1PF級個人超級電腦,將高效能推理能力帶入桌面端,開啟「個人AI工廠」時代。
分析師認為,DGX系列產品將重塑高效能運算市場,並對戴爾、聯想等合作夥伴的生態系產生深遠影響。
- 軟體生態:從推理框架到6G通訊的全面覆蓋
軟體層面的突破被視為AI工廠落地的關鍵:
- NVIDIA Dynamo:開源推理框架透過多GPU智能排程,將代幣生成效率提升30倍,直接降低Tokenization成本。
- Halos安全平台:整合硬體安全模組與AI演算法,為自動駕駛與機器人提供可信賴的決策架構。
- Aerial 6G平台:與T-Mobile、思科合作開發AI原生無線技術,為未來「雲邊端協同推理」鋪墊基礎設施。
此外,Isaac GR00T N1人形機器人基礎模型的推出,標誌著物理AI(Physical AI)進入雙系統決策時代,透過Omniverse-Cosmos的虛實整合訓練,加速機器人適應動態環境。
全端式佈局下的AI經濟新秩序
Counterpoint Research副總裁Neil Shah指出,NVIDIA透過「矽晶-系統-軟體」的全端式創新,正將AI工廠從概念轉為產業標準。此策略不僅強化其在AI推理市場的主導權,更透過CUDA-X微服務與開源框架,構建開發者生態的護城河。
隨著Tokenization需求爆發,AI工廠的效能將直接決定企業在生成式AI競賽中的成敗。而NVIDIA的技術藍圖,從Rubin架構的100PF算力到Dynamo的30倍效率躍升,無不緊扣「降低每Token成本」的核心目標。這場運算革命,或許正預示著AI經濟從「數據囤積」邁向「算力精煉」的新篇章。