本月初,英偉達(dá)超越微軟重奪全球市值第一的寶座,算是從 DeepSeek 帶來的沖擊中緩過了勁。但按下葫蘆浮起瓢,作為 AI 行業(yè)的 " 帶頭大哥 ",OpenAI 最近站出來給英偉達(dá)添堵了。根據(jù)海外媒體 The Information 的相關(guān)報(bào)道顯示,OpenAI 準(zhǔn)備將谷歌的 TPU 芯片納入采購清單,以為 ChatGPT 及其他 AI 產(chǎn)品提供算力支持。
OpenAI 選擇用谷歌 TPU 取代部分英偉達(dá) GPU 的原因其實(shí)很簡單,因?yàn)楹笳叩膬r(jià)格太高、太搶手了。據(jù)悉,英偉達(dá)的旗艦芯片 B200 擁有高達(dá) 2080 億的晶體管數(shù)量和 192GB 的 HBM3E 內(nèi)存容量,提供 8TB/s 的內(nèi)存帶寬,采用的是 Blackwell 架構(gòu),AI 性能在 FP8 及新的 FP6 上都可以達(dá)到 20PFLOPS,是前代 Hopper 構(gòu)架 H100 運(yùn)算性能 8PFLOPS 的 2.5 倍。
作為對比,谷歌的 TPU 芯片價(jià)格則更加低廉。以蘋果打造 Apple Foundation Model 模型時(shí)采購的谷歌 TPUv5p 為例,盡管雙方并未披露這筆訂單的具體信息,但業(yè)界普遍認(rèn)為 TPUv5p 的單價(jià)或在數(shù)千美元級(jí)別。
其實(shí) OpenAI 與谷歌 AI 模型的 API 定價(jià),也可以從側(cè)面證明 TPUv5p 的低成本特質(zhì)。OpenAI 旗艦?zāi)P?GPT-o3 提供的輸入價(jià)格是 10 美元 / 百萬 tokens、輸出價(jià)格是 40 美元 / 百萬 tokens,而谷歌旗艦?zāi)P?Gemini 2.5 Pro 的輸入價(jià)格和輸出價(jià)格分別是 1 美元 / 百萬 tokens 和 4 美元 / 百萬 tokens。
事實(shí)上,TPU 是一個(gè)專門針對自然語言處理、圖像識(shí)別等典型 AI 任務(wù)進(jìn)行優(yōu)化的芯片,與通用的 GPU 截然相反。英偉達(dá)的 GPU 最初是為圖形渲染服務(wù),而實(shí)現(xiàn)高性能圖形渲染的一個(gè)重要方法就是并行計(jì)算。比如在渲染 1920 × 1080 分辨率的畫面時(shí),GPU 會(huì)將 400 萬個(gè)像素分配給 4000 個(gè)核心同步處理,每個(gè)核心只需要完成 " 這個(gè)像素該顯示什么顏色 " 的簡單指令即可。
簡而言之,類似 " 瑞士軍刀 " 的 GPU 可謂是功能強(qiáng)大,既能用于渲染圖形,又可以用來進(jìn)行 AI 訓(xùn)練和推理,而 TPU 的用途則非常單一,只能用于 AI 計(jì)算。
對于 OpenAI 而言,圖形渲染能力對他們顯然毫無意義,并行計(jì)算能力才是所需的資源。從某種意義上來說,過去數(shù)年時(shí)間里,OpenAI 采購英偉達(dá) GPU 時(shí)其實(shí)一直是在 " 買櫝還珠 "。
不僅如此,作為開源模型,DeepSeek 的成功還讓相當(dāng)一批 AI 廠商放棄大模型賽道,并轉(zhuǎn)向智能體、AI 應(yīng)用。以至于進(jìn)入 2025 年以來,曾被各大 AI 廠商掛在嘴邊的 " 預(yù)訓(xùn)練 " 正逐漸被 " 推理 " 取代,推理需求的增長曲線更是變得異常陡峭。
所以雖然在 CUDA 生態(tài)的加持下,英偉達(dá) GPU 在 AI 訓(xùn)練上無人能敵,可偏偏 DeepSeek 戳破了訓(xùn)練算力需求這個(gè)泡沫,就給了 OpenAI 實(shí)現(xiàn)算力供應(yīng)多元化的機(jī)會(huì)。其實(shí)這對于國內(nèi) AI 廠商來說也是一個(gè)好消息,畢竟英偉達(dá)在 CUDA 生態(tài)上的積累不是一朝一夕就能彎道超車的,但用 TPU 代替 GPU 現(xiàn)階段更有可行性。
【本文圖片來自網(wǎng)絡(luò)】