" 我們可能無(wú)法全部恢復(fù)先前的庫(kù)存減計(jì)損失,但大多數(shù)庫(kù)存是可以恢復(fù)的。新的客戶(hù)需求和我們現(xiàn)有的庫(kù)存產(chǎn)品是可以匹配的,所以不能說(shuō) 100% 恢復(fù),但也不是完全沒(méi)有可能。"
這是英偉達(dá)創(chuàng)始人黃仁勛對(duì) H20 芯片解禁后的最新表態(tài)。他在鏈博會(huì)上的上述講話(huà),無(wú)疑給了英偉達(dá)國(guó)產(chǎn)平替?zhèn)円挥洂灩鳌?/p>
此前,在 2025 年一季度財(cái)報(bào)電話(huà)會(huì)上,黃仁勛對(duì)外提到,因中國(guó)芯片出口限制帶來(lái)的計(jì)提損失一季度 55 億美元,二季度有望升至 80 億美元,總損失達(dá)到近 1000 億元人民幣。
作為對(duì)比,2024 年,英偉達(dá)在中國(guó)交付了超過(guò) 100 萬(wàn)張 H20 芯片。按照彼時(shí)單芯片 1.2 萬(wàn)美元到 1.3 萬(wàn)美元的售價(jià)計(jì)算,僅 H20 就為英偉達(dá)貢獻(xiàn)了超過(guò) 120 億美元的營(yíng)收,超過(guò)上一財(cái)年英偉達(dá)中國(guó)區(qū)的整體營(yíng)收。
近千億的潛在虧損,直接影響著英偉達(dá)在中國(guó)芯片江湖的市場(chǎng)地位。5 月份參加 Computex 2025 期間,黃仁勛對(duì)外表示英偉達(dá)在中國(guó) AI 芯片的份額已經(jīng)從 2022 年出口管制期間的 95%,下降至 50%。伴隨而來(lái)的,則是英偉達(dá)在中國(guó)的市場(chǎng)的營(yíng)收占比從 2022 年的約 40%,下降到不到 20%。
國(guó)產(chǎn)芯片廠商們,成了英偉達(dá)中國(guó)市場(chǎng)份額下滑中的最大贏家。以 DeepSeek R1 為代表的推理模型的到來(lái),更是為國(guó)產(chǎn)芯片瓜分英偉達(dá)平添了一份助力。
2025 年前,大模型行業(yè)更多處在預(yù)訓(xùn)練階段,一眾國(guó)產(chǎn)芯片廠商都難以在訓(xùn)練效率和結(jié)果上匹敵英偉達(dá)芯片。但進(jìn)入后訓(xùn)練階段的推理模式后,調(diào)用大模型過(guò)程中,隨著客戶(hù)對(duì)芯片性能的要求直線下降,落后英偉達(dá)好幾代的國(guó)產(chǎn)芯片廠商們,終于等來(lái)一次難得的平替機(jī)會(huì)。
據(jù)字母榜了解,華為在昇騰芯片加持下,一度在今年一季度的 DeepSeek 一體機(jī)市場(chǎng),占據(jù)了超 70% 的份額。
寒武紀(jì)更是憑借飆漲的訂單量,罕見(jiàn)地完成了扭虧為盈。沐曦股份和摩爾線程等初創(chuàng)芯片公司,更是在蜂擁訂單助力下,紛紛開(kāi)啟了上市沖刺。
但 H20 芯片解禁消息一出,處在加速度中的國(guó)產(chǎn)芯片廠商,不可避免將迎來(lái)新一輪業(yè)務(wù)震蕩期。
一
除了搶占以 DeepSeek 一體機(jī)為代表的推理市場(chǎng),華為還瞄準(zhǔn)了英偉達(dá)占據(jù)核心的訓(xùn)練市場(chǎng),發(fā)起進(jìn)攻。
在單卡性能不如英偉達(dá)的顯示前提下,華為采取了以量取勝的笨辦法,借助比英偉達(dá)更多的多卡集群來(lái)補(bǔ)上差距。
4 月份,華為對(duì)外推出 CloudMatrix 384 超節(jié)點(diǎn),官方稱(chēng)其已在蕪湖數(shù)據(jù)中心規(guī)模上線。據(jù) " 科創(chuàng)板日?qǐng)?bào) " 報(bào)道,華為內(nèi)部人士稱(chēng)其為核彈級(jí)的產(chǎn)品,或?qū)氐捉K結(jié)算力焦慮。
傳統(tǒng) AI 服務(wù)器通常包括 8 張算力卡,一臺(tái)服務(wù)器稱(chēng)為一個(gè)節(jié)點(diǎn)。在 ChatGPT 掀起大模型浪潮,并驗(yàn)證了縮放法則(Scaling Law)的正確性后,更大的算力集群,便成了訓(xùn)練出更優(yōu)模型的必備條件。
為此,AI 廠商不得不構(gòu)建起包括成千上萬(wàn)張 GPU 算力卡的算力集群,這便帶來(lái)了卡與卡之間互聯(lián)和通信的新麻煩。
針對(duì)上述難題,2024 年 3 月,英偉達(dá)率先發(fā)布了 NVL72 超節(jié)點(diǎn),支持把 72 張算力卡組成一個(gè)超節(jié)點(diǎn),為萬(wàn)億參數(shù)的大模型訓(xùn)練和推理提供服務(wù)。
作為對(duì)比,華為 CloudMatrix 384 顧名思義便是以 384 張昇騰算力卡組成一個(gè)超節(jié)點(diǎn),從而在規(guī)模、性能和可靠性上對(duì)標(biāo)英偉達(dá)的 NVL72。
華為的野心時(shí)刻被黃仁勛看在眼中。在談及國(guó)產(chǎn)芯片競(jìng)爭(zhēng)時(shí),黃仁勛再度提及華為," 任何低估華為、低估中國(guó)制造能力的人,都是極其天真無(wú)知的。華為是一家非常強(qiáng)大的公司,我以前見(jiàn)過(guò)他們開(kāi)發(fā)出的技術(shù)……他們能夠做到和我們接近,這說(shuō)明了一切。"
華為之外,作為當(dāng)前 GPU 芯片上市第一股的寒武紀(jì),則用更直觀的財(cái)報(bào)數(shù)據(jù),向外界展示了是如何瓜分英偉達(dá)蛋糕的。
2025 年一季度,寒武紀(jì)實(shí)現(xiàn)營(yíng)業(yè)收入 11.11 億元,同比暴漲 4230.22%,接近去年全年?duì)I收。歸屬于上市公司股東的凈利潤(rùn) 3.55 億元,上年同期為虧損 2.27 億元,實(shí)現(xiàn)歷史性的扭虧為盈。這也是寒武紀(jì)連續(xù)第二季度實(shí)現(xiàn)盈利,去年第四季度寒武紀(jì)歸母凈利約為 2.81 億元。
更多創(chuàng)業(yè)公司也在暴漲訂單助力之下,開(kāi)始搶奪上市窗口期,包括沐曦股份和摩爾線程在內(nèi),都于年內(nèi)提交了 IPO 申請(qǐng)。
二
但在國(guó)產(chǎn)芯片廠商紛紛爭(zhēng)當(dāng)英偉達(dá)平替的另一面,則是他們受限于產(chǎn)能等因素,還無(wú)法把到手的訂單全部消化。
以寒武紀(jì)為例,盡管其一季度營(yíng)收暴漲超 40 倍,但絕對(duì)值上也只有約 11 億元人民幣,相比英偉達(dá)一季度 55 億美元的計(jì)提損失,占比不到 3%。
就在國(guó)產(chǎn)芯片還在等待產(chǎn)能提升的當(dāng)下,英偉達(dá) H20 芯片值此解除禁售,等于反過(guò)來(lái)又搶了一波國(guó)產(chǎn)芯片的空窗期。這一變動(dòng),將直接影響三季度后的國(guó)產(chǎn)芯片廠商整體營(yíng)收規(guī)模,也將搶占國(guó)產(chǎn)芯片原本就不大的市場(chǎng)空間。
年初 DeepSeek 爆火帶動(dòng)一眾科技大廠加碼 To C 應(yīng)用時(shí),尤其是騰訊元寶因接入 DeepSeek 流量暴漲,有報(bào)道稱(chēng)騰訊、字節(jié)等向英偉達(dá)緊急下單了一批 H20 芯片,以滿(mǎn)足 AI 應(yīng)用的算力消耗。
但隨著 4 月份 H20 被禁,上述訂單也不了了之。近期 H20 解禁后,外界很快傳出字節(jié)、騰訊等廠商已經(jīng)向英偉達(dá)下單。對(duì)此,黃仁勛否認(rèn)稱(chēng),自己還沒(méi)來(lái)得及與任何客戶(hù)會(huì)面。" 需要一些時(shí)間來(lái)提升 H20 供應(yīng)鏈的產(chǎn)能,未來(lái)幾個(gè)月,英偉達(dá)將努力加速這一過(guò)程。"
之所以仍有一眾廠商愿意等待英偉達(dá) H20 芯片,關(guān)鍵原因之一在于,英偉達(dá)芯片在多卡串聯(lián)的并行計(jì)算環(huán)節(jié),仍然存在較大優(yōu)勢(shì)。
微軟大中華區(qū) Azure 事業(yè)部總經(jīng)理陶然便曾對(duì)外解釋道,很多廠商沒(méi)有能力去實(shí)現(xiàn)多卡連接,但多卡并行運(yùn)算卻直接決定著大模型訓(xùn)練所需花費(fèi)的時(shí)間成本," 同樣的一套模型,如果訓(xùn)練一次需要花費(fèi)一周成本為 100 萬(wàn)美元,但如果帶寬太小最終耗時(shí)兩周,那成本就將乘以 2。"
在崇尚效率的大模型賽道,時(shí)間有時(shí)比金錢(qián)更重要。更糟糕的是,即便是在更換國(guó)產(chǎn) GPU 的過(guò)程中,國(guó)內(nèi) AI 廠商眼下也面臨無(wú)法使用更先進(jìn)制程工藝芯片的挑戰(zhàn)。美國(guó)相關(guān)部門(mén)已經(jīng)將壁仞、摩爾線程等國(guó)產(chǎn) GPU 公司列入實(shí)體清單,這意味著在沒(méi)有獲得許可的情況下,它們既不能進(jìn)口含有美國(guó)公司的任何技術(shù)或產(chǎn)品,也不能通過(guò)臺(tái)積電等代工廠生產(chǎn) 14nm 以下的先進(jìn)芯片。
對(duì)國(guó)產(chǎn)芯片廠商來(lái)說(shuō),算得上好消息的一點(diǎn)是,從 2022 年開(kāi)始的英偉達(dá)芯片禁令,把控方向正變得越來(lái)越嚴(yán)格,且政策還往往易變。即便 H20 芯片解禁,從供應(yīng)鏈穩(wěn)定和安全的角度考量,部分 AI 廠商也需要這些國(guó)產(chǎn)芯片廠商繼續(xù)供貨。
三
英偉達(dá)的麻煩并未隨著 H20 的解禁而告一段落。相比上半年近千億的損失,更令英偉達(dá)擔(dān)憂(yōu)的,則是大客戶(hù)紛紛自研芯片的現(xiàn)狀。這一景象已經(jīng)在美國(guó)陸續(xù)發(fā)生。
為了降低用云成本,微軟、谷歌等美國(guó)頭部云廠商開(kāi)始加速自研服務(wù)器芯片和云端 AI 芯片。
" 如果你能制造出針對(duì) AI 進(jìn)行優(yōu)化的硅,那前方等待你的將是巨大的勝利。" 研究公司 Forrester 分析師格倫 · 奧唐納形容道。
谷歌曾是最早大規(guī)模采購(gòu) GPU 來(lái)進(jìn)行 AI 計(jì)算的公司,但后來(lái)研發(fā)自己的 AI 專(zhuān)用芯片,在 2016 年就已經(jīng)發(fā)布了第一代 TPU(張量處理單元)。如今,從 AI 繪圖公司 Midjourney,到 AI 獨(dú)角獸公司 Anthropic,都開(kāi)始使用起了谷歌的算力。
亞馬遜也借助 2015 年收購(gòu)的以色列芯片初創(chuàng)公司 Annapurna Labs,在 2018 年前后推出了基于 Arm 的服務(wù)器芯片和 AI 芯片,并開(kāi)始將自研算力服務(wù)器兜售給包括 OpenAI、Anthropic 等在內(nèi)的 AI 大客戶(hù),從而擠占英偉達(dá)的市場(chǎng)份額。
就連一貫英偉達(dá)強(qiáng)綁定的 OpenAI,也在內(nèi)部籌劃著自研芯片的事情。至少?gòu)?2022 年開(kāi)始,OpenAI 就已經(jīng)討論了各種方案,希望能解決芯片又貴又短缺的問(wèn)題,自研芯片便是方案之一。
對(duì)需求量大的國(guó)內(nèi)科技大廠而言,成本壓力也是華為、阿里、百度、字節(jié)、騰訊等自研芯片的原因之一。國(guó)信證券在一份研報(bào)中稱(chēng),處理器芯片占服務(wù)器 BOM(物料清單)成本約 40%。
在阿里、百度相繼推出各自的平頭哥和昆侖芯計(jì)劃之后,2021 年 3 月,媒體曝出字節(jié)跳動(dòng)正在自主研發(fā)云端 AI 芯片和 Arm 服務(wù)器芯片。字節(jié)跳動(dòng)隨后證實(shí),正在組建芯片團(tuán)隊(duì)。
幾乎在同一時(shí)間,騰訊也被曝出多個(gè)芯片研發(fā)崗位的招聘信息。官方隨后回應(yīng),騰訊正在研發(fā)的并非通用芯片,而是基于一些業(yè)務(wù)需要,在特定領(lǐng)域展開(kāi)的協(xié)處理器研發(fā)嘗試,比如 AI 加速和視頻編解碼等。
類(lèi)比當(dāng)前智能手機(jī)領(lǐng)域的芯片競(jìng)爭(zhēng)格局,展望未來(lái)的 AI 芯片領(lǐng)域,未必不會(huì)達(dá)成部分復(fù)雜場(chǎng)景用英偉達(dá)芯片,部分簡(jiǎn)單場(chǎng)景用自研和國(guó)產(chǎn)芯片的混合計(jì)算架構(gòu)局面。
但想要維持上述局面的一大前提是,黃仁勛得避免讓英偉達(dá)芯片再度迎來(lái)出口禁令。
本文來(lái)自微信公眾號(hào):字母榜,作者:趙晉杰