文 | 海豚投研
在最近博通帶著 ASIC 高歌猛進(jìn)的情況下,英偉達(dá)為首的 GPU 陣營明顯是遇到了挑戰(zhàn)。博通的股價(jià)在財(cái)報(bào)發(fā)布的當(dāng)天上漲將近 10%,而 $ 英偉達(dá) ( NVDA.US ) 和 AMD 分別下跌了 3% 和 6%。尤其是博通第四個(gè)客戶的百億訂單,直接給市場(chǎng)帶來了 ASIC 搶占 AI 核心芯片市場(chǎng)的期待。
如果將當(dāng)前數(shù)據(jù)中心市場(chǎng)中核心芯片廠商的相關(guān)收入進(jìn)行對(duì)比,博通在 AI 芯片市場(chǎng)的份額已經(jīng)將近 1 成,實(shí)現(xiàn)了對(duì)英特爾和 AMD 的超越。博通當(dāng)前具有 "3 個(gè)量產(chǎn)客戶 +4 個(gè)潛在客戶 ",隨著潛在客戶的產(chǎn)品進(jìn)入量產(chǎn)(比如第 4 個(gè)客戶),有望給公司帶來更多的增量。
對(duì)于本款 "Rubin CPX" GPU 新品,英偉達(dá)主要提了 3 個(gè)方面:
a)算力及內(nèi)存:算力高達(dá)30PFLOPS(NVFP4 精度);配備128GB 高性價(jià)比 GDDR7 內(nèi)存,加速高要求上下文工作負(fù)載。
雖然算力低于 3 月發(fā)布 Rubin GPU 的 50PFLOPS(FP4 精度),但與英偉達(dá) GB300 NVL72 系統(tǒng)相比,這款專用 GPU 還提供了 3 倍更快的注意力機(jī)制(Attention Mechanism)。
公司計(jì)劃在 2026 年推出常規(guī) Rubin GPU 之后,于 2026 年底推出該產(chǎn)品。
NVIDIA Vera Rubin NVL144 CPX——集成 36 個(gè) Vera CPU、144 塊 Rubin GPU 和 144 塊 Rubin CPX GPU,提供 8 EFLOPs 的 NVFP4 算力,是 GB300 NVL72 的 7.5 倍。同時(shí)單個(gè)機(jī)架就能提供 100 TB 的高速內(nèi)存和 1.7 PB/s 的內(nèi)存帶寬。
Rubin CPX 提供多種配置,包括 Vera Rubin NVL144 CPX,可與 NVIDIA Quantum X800 InfiniBand 橫向擴(kuò)展計(jì)算架構(gòu)或搭載英偉達(dá) Spectrum-XGS 以太網(wǎng)技術(shù)和 ConnectX-9 SuperNIC 的 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)結(jié)合使用。
Vera Rubin NVL144 CPX 能得到前所未有的規(guī)模變現(xiàn),每投資 1 億美元即可獲得 50 億美元 token 收益。
由于推理階段往往分為上下文階段和生成階段兩個(gè)環(huán)節(jié),其中前者的限制點(diǎn)在計(jì)算能力,需要高吞吐量來處理和分析海量數(shù)據(jù);后者的限制點(diǎn)在內(nèi)存帶寬,依賴于內(nèi)存?zhèn)鬏敽透咚倩ヂ?lián)來維持輸出性能。
英偉達(dá)本次推出 Rubin CPX 的專用 GPU,主要針對(duì)于海量數(shù)據(jù)情況下,提升上下文階段的速度。而在具體的 Rubin 體系中,通過 GPU+ 專用 GPU 的搭配,實(shí)現(xiàn)優(yōu)化。其中 CPX 承擔(dān)上下文階段的工作,其中采用 GDDR7 內(nèi)存,而不必要用 HBM 內(nèi)存也能滿足需求。而原有 Rubin GPU 仍負(fù)責(zé)生成環(huán)節(jié)。
雖然 Rubin CPX 仍是 GPU 范疇,從具體職責(zé)來看,主要就是面向于推理來設(shè)計(jì),承擔(dān)上下文階段的提速作用。隨著 Rubin CPX 的發(fā)布,公司在 Rubin 階段的產(chǎn)品形態(tài)也更加清晰。搭載 "CPU+GPU+CPX GPU" 的 NVIDIA Vera Rubin NVL144 CPX,將是 Rubin 階段的主要產(chǎn)品,具體客戶也將主要面向于核心云廠商等大型公司,這些也是 ASIC 的主要目標(biāo)客群。
本次公司發(fā)布專用于 " 推理 " 的 Rubin CPX,是對(duì)博通等 ASIC 產(chǎn)品的直接回應(yīng)。之前部分客戶從 " 性價(jià)比 " 的角度嘗試定制 ASIC 芯片,并取得不錯(cuò)的效果。而 Rubin CPX 的推出,也能對(duì)大規(guī)模云廠商起到 " 降本增效 " 的作用。與其面對(duì)自研的不確定性,采用英偉達(dá)的 CPX 及一整套 Rubin 方案也是一個(gè)選項(xiàng)。
在各家核心云廠商提升資本開支的情況下,近期博通拿到百億訂單和甲骨文的剩余履約合同價(jià)值也直接飆漲了 3000 億。種種跡象都表明,當(dāng)前美國大廠們都已經(jīng)是基建狂魔了。而在 AI 需求旺盛的情況下,整個(gè)市場(chǎng)的蛋糕越做越大。英偉達(dá)和博通 "GPU vs ASIC 之爭(zhēng) " 的問題,將回歸到誰最終能分到更大的蛋糕。