黃仁勳指出,Groq 晶片完全是為推論設計。值得注意的是,該晶片由三星(Samsung)代工製造,且已經投入量產階段。黃仁勳指出,Groq 晶片完全是為推論設計。值得注意的是,該晶片由三星(Samsung)代工製造,且已經投入量產階段。

【NVIDIA GTC 2026】推論時代來臨!NVIDIA 正式推出 Vera Rubin、Vera CPU 以及全新「推論加速器」

2026/03/17 04:46
閱讀時長 8 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 [email protected] 聯絡我們。

NVIDIA 今日舉辦 GTC 2026,執行長黃仁勳在主題演講中的硬體重頭戲之一莫過於新一代 AI 加速平台 Vera Rubin。另外兩個大亮點則是 Vera CPU,以及推論加速器 NVIDIA Groq 3 LPX。

 

推論與代理時代的來臨

「推論(inference)」一詞無疑是 NVIDIA GTC 2026 的主角。

黃仁勳指出,AI 已經發展到能夠進行實際生產性工作的階段。現在的 AI 必須要「思考」、「推理」並「採取行動」,而這每一個過程都需要生成 Token,也就是必須進行「推論」。他強調,AI 的發展已經遠遠超過了單純的「訓練」階段,正式進入了推論的領域。

因為這個推論轉折點的到來,過去兩年內生成 Token 的運算量增加了約一萬倍,整體運算需求甚至可以說暴增了一百萬倍。黃仁勳回顧去年他曾預測,到 2026 年 Blackwell 與 Rubin 架構將帶來約 5,000 億美元的高信心度訂單需求。但他接著宣布,站在現在這個時間點觀察,他預測到 2027 年,全球 AI 基礎設施的需求將達到「至少一兆美元(at least trillion dollars)」。

NVIDIA 在今日正式宣布推出為此而生的 Vera Rubin,這套系統涵蓋了 CPU、儲存、網路與安全,並將 7 款不同的晶片整合進 5 台機架級電腦中,形成一個從硬體到軟體的巨型系統。

Vera Rubin 被定位為專為「代理式 AI(Agentic AI)」所有階段量身打造的革命性平台,可說是產能暴增的「Token 工廠」,在一個 1GW(十億瓦)功耗的資料中心內,Vera Rubin 能在兩年內將 Token 的生成速度從 200 萬暴增至 7 億,達到 350 倍的驚人成長 。相較於 Blackwell,Vera Rubin 預計能為高吞吐量需求的客戶帶來 5 倍的營收增長效益 。

其搭配的 Vera CPU 提供了極高的單執行緒效能與資料處理能力,專門負責處理 AI 協調與工具使用(如呼叫網頁瀏覽器或雲端虛擬電腦),確保 AI 操作工具時能保持極低延遲。

今天大會上,不僅展示了 Vera Rubin,還首度拿出了採用全新垂直插拔設計、搭配 Kyber 機架的下一代運算節點 Rubin Ultra。這項全新的硬體與中介板(midplane)設計,讓系統能在單一 NVLink 內串連高達 144 個 GPU,形成龐大的算力規模。

今天的另一個主角是推論加速器 NVIDIA Groq 3 LPX,用以加速 AI 模型的回應速度。這項產品是去年 NVIDIA 砸下 200 億美元延攬新創 Groq 團隊之後推出的首批成果。

NVIDIA Groq 3 LPX 與  Vera Rubin 系統緊密結合,作為專屬的 Token 加速器,兩者結合能帶來高達 35 倍的每百萬瓦吞吐量提升。黃仁勳指出,Groq 晶片完全是為推論設計。值得注意的是,該晶片由三星(Samsung)代工製造,且已經投入量產階段。

黃仁勳指出,NVIDIA 透過 Dynamo 作業系統將推論流程拆解。由具備龐大記憶體的 Vera Rubin 處理 Prefill(預填)與 KV Cache 儲存,而將極需低延遲與高頻寬的 Decode(解碼與 Token 生成)交由 Groq 負責,兩者透過乙太網路緊密協作。

黃仁勳指出,微軟 Azure 已經成功上線了全球第一台 Vera Rubin 機架。同時,NVIDIA 已經具備極高的量產能力,其供應鏈每週可生產數千台此類系統,全力應付全球 AI 工廠基礎設施的建置需求。

再來則是 CPU,黃仁勳在演講中直說,「沒想到 NVIDIA 會有單獨銷售 CPU 的一天」,那就是今天亮相的 Vera CPU。

黃仁勳解釋,隨著 AI 發展到代理(Agentic)階段,AI 不僅需要思考,還需要「採取行動與使用工具」(例如呼叫網頁瀏覽器或雲端虛擬電腦)。為了確保 AI 在操作工具時能保持極低延遲,NVIDIA 設計了這款全新的 Vera CPU。它的定位原本是為了與 Vera Rubin 系統中的其他基礎設施完美配合,專門處理 AI 的協調工作與工具使用。

Vera CPU 提供極高的單執行緒效能(single-thread performance)與強大的資料處理能力,並且擁有當今全球 CPU 中最高的極致能源效率(每瓦效能為其他 CPU 的兩倍),亦是全球唯一使用 LPDDR5 記憶體的資料中心 CPU。

黃仁勳提到,未來的 AI 會頻繁存取大量資料,這將讓資料中心的儲存系統承受極巨大的壓力。為了解決這個問題,Vera CPU 結合了 CX9 與 BlueField-4 網路晶片,驅動了全新的 STX AI 原生儲存平台。這套架構精準打中了市場痛點,導致全球百分之百的儲存產業都加入了採用此系統的行列。

黃仁勳指出,正因為 Vera CPU 在效能表現與解決儲存痛點上過於成功,完美切中了市場的甜蜜點,使得市場對這顆 CPU 本身產生了極大的需求。這導致 NVIDIA 打破了原先只打算將其作為系統一部分的預期,開始大量「單獨販售」Vera CPU,而這項單獨販售 CPU 的業務,毫無疑問將會成為 NVIDIA 一項「價值數十億美元的業務」。

核稿編輯:Mia 

加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!

延伸閱讀:

  • NVIDIA 版綠色龍蝦「NemoClaw」傳於 GTC 2026 亮相,主打企業級 AI 代理應用

  • 【NVIDIA GTC 2026】CUDA 20 週年:從智慧交通到電信,NVIDIA 已深入各層面

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。