" 中國芯片要爆發(fā)了。"
官宣完 " 地表最強 " 的英偉達新 GPU 后,黃仁勛面對全球媒體的鏡頭如是說。
他還大夸中國模型,直言 Qwen、DeepSeek 都是 " 世界級、革命性 " 的成果。
近一個小時的接連提問,有一半的問題都關于中國,仿佛讓人忘了英偉達的新成果才是這場發(fā)布會的主角。

該款芯片也正是 OpenAI 英偉達千億大單第一階段要部署的芯片,現(xiàn)在老黃手里已經(jīng)有了樣品,預計明年實現(xiàn)量產(chǎn)。
此外,老黃還官宣了英偉達在量子計算、6G 通信、自動駕駛等其他領域的戰(zhàn)略布局。

Vera Rubin 平臺是繼 GB200(Grace Blackwell NVLink 72)之后的第三代 NVLink 72 機架規(guī)模的計算機,從芯片、系統(tǒng)、軟件到模型架構(gòu)都進行了全新設計。
而最核心的 Vera Rubin 超級芯片則是搭載了一顆 Vera CPU 和兩顆大型的 Rubin GPU。
英偉達已經(jīng)收到了首批由臺積電生產(chǎn)的 Rubin GPU,每個 GPU 芯片都采用了 HBM4 高帶寬內(nèi)存,主板其他區(qū)域配備了 32 個 LPDDR 內(nèi)存插槽,和 HBM4 內(nèi)存協(xié)同工作。
在 FP4 精度下,浮點計算性能可達 50PFLOPs,相較于現(xiàn)有的 GB300,性能有數(shù)倍躍遷。
而 Vera 則采用 Arm 架構(gòu),搭載了 88 個核心以及 176 線程,NVLINK-C2C 互聯(lián)帶寬可達 1.8TB/s。

這個計算托盤的核心處理器內(nèi)置了兩個 Vera CPU 和四個 Rubin 封裝,形成了強大的算力核心。
而為了應對 AI 日益增長的對于上下文處理的需求,英偉達還在托盤中新增了 Bluefield 4 數(shù)據(jù)處理器,配備了 8 個全新的 ConnectX-9 超級網(wǎng)卡。
不過,老黃表示 Vera Rubin 計算托盤的安裝過程極其簡單,甚至調(diào)侃道:
連我都能做到。

而升級版的 Rubin Ultra NVL576 將在 2027 年下半年推出,將 NVL 系統(tǒng)規(guī)模從 144 擴展到 576,F(xiàn)P4 推理算力可以達到 15Exaflops,F(xiàn)P8 訓練算力達 5Exaflops,相較 GB300 NVL72 提升 14 倍。
英偉達科學家范麟熙(Jim Fan)評價:科幻場景與 " 真實的《黑客帝國》" 相比黯然失色。

其中,Mission 和 Vision 兩臺基于 Vera Rubin 平臺的新超級計算機是與 HPE 合作,為洛斯阿拉莫斯國家實驗室建造的,預計 2027 年投入使用。
下一代超級芯片蓄勢待發(fā)時,當前的 Blackwell 架構(gòu)也實現(xiàn)了量產(chǎn),正在大規(guī)模生產(chǎn)和部署。
黃仁勛透露,涵蓋至 2026 年的出貨量,Blackwell 和 Rubin 的訂單總銷售額將達到 5000 億美元。
現(xiàn)場老黃又搬出了 GPU 未來三年計劃——到 2028 年推出 Feynman。
就像從 Blackwell 到 Rubin 的節(jié)奏一樣,承諾每年一次重大更新。

AI 超算與量子處理器的無縫連接
量子計算,一個獲得諾貝爾物理學獎的熱門課題,英偉達在這方面也有所布局。
這次演講中,NVIDIA 發(fā)布了NVQLink,這是一種新的互連架構(gòu),可以直接連接量子處理器(QPUs)和 NVIDIA GPU,首次實現(xiàn)了 AI 超算與量子處理器的無縫連接。

功能上,NVQLink 負責量子計算機的控制和校準、量子錯誤校正,以及連接 QPU 和 GPU 超級計算機以進行混合模擬。
并且該架構(gòu)具有完全可擴展性,可以處理從當前的數(shù)百個量子比特擴展到未來數(shù)萬甚至數(shù)十萬個量子比特的糾錯需求。
為了實現(xiàn)這種融合,NVIDIA 推出 CUDA-Q,這是一個用于量子 GPU 計算的開放平臺, 將 CUDA 擴展到支持 QPU,使之能夠與 GPU 協(xié)同工作。
之前的 GTC 巴黎站上,英偉達宣布已經(jīng)在 Blackwell 集成了 CUDA-Q,通過 GPU 為量子計算加速,其功能主要有兩大方面:
如果沒有真 · 量子計算單元,CUDA-Q 可以在經(jīng)典計算機上模擬量子運算;
如果有了量子計算單元,CUDA-Q 可以實現(xiàn)量子與經(jīng)典加速計算的協(xié)同,也就是 QPU 協(xié)作。

投資諾基亞,入局 6G 通信
英偉達認為,加速計算和 AI 給通信行業(yè)也帶來了一場新計算模型所驅(qū)動的平臺轉(zhuǎn)型。
為此,英偉達宣布推出新的產(chǎn)品線,名為NVIDIA Arc ( Aerial Radio Network Computer ) ,專門用于 6G。
Arc 由三項基礎新技術構(gòu)建而成—— Grace CPU、Blackwell GPU 以及 ConnectX Melanox 網(wǎng)絡技術。
Arc 運行在 CUDA X 庫中的無線通信系統(tǒng) Aerial 上,目標是創(chuàng)建首個能夠同時進行無線通信和 AI 處理的、軟件定義的可編程計算機。
具體來說,英偉達與諾基亞達成合作推出了支持 AI 原生 6G 的加速計算平臺—— Aerial RAN Computer Pro(ARC-Pro)。
這是一款 AI 基站主機,搭載了 6G-ready 加速計算平臺,并實現(xiàn)了無線 +AI 共生,把 AI 推理傳統(tǒng) RAN 處理跑在了同一套基礎設施上。


無論是英偉達的 " 現(xiàn)金奶牛 " 數(shù)據(jù)中心,還是新布局的量子計算和 6G,英偉達都不無對手、都有潛在挑戰(zhàn)者。
隔壁 AMD 剛剛拿下了兩臺超算訂單,金額為 10 億美元。
這兩臺超級計算機的主要硬件部分將全部由 AMD 打造其中的首臺名為 Lux,搭載 AMD Instinct MI355X 加速器 ,每臺板載功率高達 1400 瓦,預計將在六個月內(nèi)投入使用。

除了 AMD,不滿足于在端側(cè)發(fā)展的高通也想要分一杯羹,宣布推出兩款全新的 AI 芯片——AI200和AI250,正式進軍數(shù)據(jù)中心市場。
這兩款芯片聚焦 AI 模型的推理階段,主打行業(yè)最低的總擁有成本(TCO)、更高的能效與更強的內(nèi)存處理能力,分別預計于 2026 和 2027 年實現(xiàn)商用。

還有老黃看好的量子計算領域,甚至出現(xiàn)了不同路線的競爭——
英偉達認為 GPU 和 QPU 的組合是量子計算的未來,但 IBM 成功用 AMD 芯片實現(xiàn)了無 GPU 的量子計算。
IBM 的算法解決了量子計算中最核心的挑戰(zhàn)之一——量子比特的脆弱性與高錯誤率。
這套方案的運行速度比實際需求快 10 倍,而且不需要昂貴的 GPU,只需要 FPGA 芯片與量子計算機配合。

去年 7 月,北郵張平院士團隊成功搭建了國際上首個通信與智能融合的 6G 試驗網(wǎng)。
今年 8 月,北京大學和香港城市大學合作的全球首款全頻段 6G 芯片問世,利用光子技術實現(xiàn)了 100Gbps 的傳輸速率。
該芯片只有 11 × 1.7mm 的尺寸,但融合了毫米波、太赫茲通信以及低頻微波波段,覆蓋了 0.5-115GHz。
這一成果被視為 6G 的關鍵突破,論文已經(jīng)登上 Nature。

若以盤后價格計算,英偉達的市值增長了 3154 億美元,折合人民幣近 3 萬億,僅增長部分就相當于 1.59 個英特爾。

參考鏈接:
[ 1 ] https://www.youtube.com/watch?v=lQHK61IDFH4
[ 2 ] https://wccftech.com/nvidia-shows-next-gen-vera-rubin-superchip-two-massive-gpus-production-next-year/
[ 3 ] https://x.com/DrJimFan/status/1983232823784853998
一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評論區(qū)留下你的想法!
— 完 —
年度科技風向標「2025 人工智能年度榜單」評選報名火熱進行中!我們正在尋找 AI+ 時代領航者 點擊了解詳情
企業(yè)、產(chǎn)品、人物 3 大維度,共設立了 5 類獎項,歡迎企業(yè)報名參與
一鍵關注 點亮星標
科技前沿進展每日見