中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      三易生活 53分鐘前

      OpenAI 甩開英偉達(dá),谷歌 TPU “橫刀奪愛”

      本月初,英偉達(dá)超越微軟重奪全球市值第一的寶座,算是從 DeepSeek 帶來的沖擊中緩過了勁。但按下葫蘆浮起瓢,作為 AI 行業(yè)的 " 帶頭大哥 ",OpenAI 最近站出來給英偉達(dá)添堵了。根據(jù)海外媒體 The Information 的相關(guān)報(bào)道顯示,OpenAI 準(zhǔn)備將谷歌的 TPU 芯片納入采購清單,以為 ChatGPT 及其他 AI 產(chǎn)品提供算力支持。

      在此之前,OpenAI 的大模型預(yù)訓(xùn)練和推理都依賴英偉達(dá) GPU,也使得其成為了后者最大的算力芯片采購方。此次轉(zhuǎn)向谷歌的 TPU 芯片,就意味著 OpenAI 方面正在嘗試擺脫對英偉達(dá)的依賴,從而實(shí)現(xiàn)算力芯片供應(yīng)的多元化。同時(shí)繼蘋果之后,谷歌的 TPU 又一次贏得 AI 大廠的訂單,也讓它徹底擺脫了 " 自家玩具 " 的定位。

      OpenAI 選擇用谷歌 TPU 取代部分英偉達(dá) GPU 的原因其實(shí)很簡單,因?yàn)楹笳叩膬r(jià)格太高、太搶手了。據(jù)悉,英偉達(dá)的旗艦芯片 B200 擁有高達(dá) 2080 億的晶體管數(shù)量和 192GB 的 HBM3E 內(nèi)存容量,提供 8TB/s 的內(nèi)存帶寬,采用的是 Blackwell 架構(gòu),AI 性能在 FP8 及新的 FP6 上都可以達(dá)到 20PFLOPS,是前代 Hopper 構(gòu)架 H100 運(yùn)算性能 8PFLOPS 的 2.5 倍。

      可是配備 8 顆 B200 的英偉達(dá) DGX B200 AI 服務(wù)器,售價(jià)就高達(dá) 50 萬美元,并且根據(jù)摩根士丹利的相關(guān)報(bào)告顯示,英偉達(dá) Blackwell GPU 未來 12 個(gè)月的產(chǎn)能已經(jīng)被預(yù)定一空。

      作為對比,谷歌的 TPU 芯片價(jià)格則更加低廉。以蘋果打造 Apple Foundation Model 模型時(shí)采購的谷歌 TPUv5p 為例,盡管雙方并未披露這筆訂單的具體信息,但業(yè)界普遍認(rèn)為 TPUv5p 的單價(jià)或在數(shù)千美元級(jí)別。

      其實(shí) OpenAI 與谷歌 AI 模型的 API 定價(jià),也可以從側(cè)面證明 TPUv5p 的低成本特質(zhì)。OpenAI 旗艦?zāi)P?GPT-o3 提供的輸入價(jià)格是 10 美元 / 百萬 tokens、輸出價(jià)格是 40 美元 / 百萬 tokens,而谷歌旗艦?zāi)P?Gemini 2.5 Pro 的輸入價(jià)格和輸出價(jià)格分別是 1 美元 / 百萬 tokens 和 4 美元 / 百萬 tokens。

      超高的性價(jià)比使得 Gemini 2.5 Pro 在問世之后很快就受到 AI 業(yè)界的青睞,毫無疑問 TPU 芯片居功至偉。在 AI 領(lǐng)域,TPU(專用向量處理器)憑借高度特化實(shí)現(xiàn)了比 GPU(圖形處理器)更便宜,同時(shí)它也是谷歌專為加速機(jī)器學(xué)習(xí)中的張量(矩陣)運(yùn)算所設(shè)計(jì)的定制硬件,其采用脈動(dòng)陣列(Systolic Array) 設(shè)計(jì),通過流水線式數(shù)據(jù)流高效處理矩陣乘法,減少了數(shù)據(jù)移動(dòng)和內(nèi)存訪問延遲。

      事實(shí)上,TPU 是一個(gè)專門針對自然語言處理、圖像識(shí)別等典型 AI 任務(wù)進(jìn)行優(yōu)化的芯片,與通用的 GPU 截然相反。英偉達(dá)的 GPU 最初是為圖形渲染服務(wù),而實(shí)現(xiàn)高性能圖形渲染的一個(gè)重要方法就是并行計(jì)算。比如在渲染 1920 × 1080 分辨率的畫面時(shí),GPU 會(huì)將 400 萬個(gè)像素分配給 4000 個(gè)核心同步處理,每個(gè)核心只需要完成 " 這個(gè)像素該顯示什么顏色 " 的簡單指令即可。

      這也是為什么 CPU 通常只有十幾個(gè)核心,可 GPU 的核心規(guī)模就會(huì)達(dá)到成千上萬的原因。到了 AI 時(shí)代,由于 AI 場景往往需要處理大規(guī)模數(shù)據(jù)和復(fù)雜的計(jì)算任務(wù),通常會(huì)呈現(xiàn)出高度并行化的狀態(tài),所以天然更契合采用并行計(jì)算的 GPU。再搭配英偉達(dá)耕耘十余年的并行計(jì)算框架 CUDA,直接就讓他們的 GPU 絲滑切入了 AI 計(jì)算領(lǐng)域。

      簡而言之,類似 " 瑞士軍刀 " 的 GPU 可謂是功能強(qiáng)大,既能用于渲染圖形,又可以用來進(jìn)行 AI 訓(xùn)練和推理,而 TPU 的用途則非常單一,只能用于 AI 計(jì)算。

      對于 OpenAI 而言,圖形渲染能力對他們顯然毫無意義,并行計(jì)算能力才是所需的資源。從某種意義上來說,過去數(shù)年時(shí)間里,OpenAI 采購英偉達(dá) GPU 時(shí)其實(shí)一直是在 " 買櫝還珠 "。

      那么問題就來了,早在 2018 年,谷歌的 TPU 芯片就開啟了外銷商用的步伐,為什么 OpenAI 直到 2025 年才將其納入采購清單呢?其實(shí)這就要?dú)w功于 DeepSeek 了。其通過稀疏化訓(xùn)練、動(dòng)態(tài)網(wǎng)絡(luò)架構(gòu)、混合專家系統(tǒng)(MoE)等工程層面的創(chuàng)新,讓大模型實(shí)現(xiàn)了低廉的訓(xùn)練和部署成本。

      不僅如此,作為開源模型,DeepSeek 的成功還讓相當(dāng)一批 AI 廠商放棄大模型賽道,并轉(zhuǎn)向智能體、AI 應(yīng)用。以至于進(jìn)入 2025 年以來,曾被各大 AI 廠商掛在嘴邊的 " 預(yù)訓(xùn)練 " 正逐漸被 " 推理 " 取代,推理需求的增長曲線更是變得異常陡峭。

      簡而言之,如今業(yè)界對于推理算力的需求其實(shí)要比訓(xùn)練算力更大,除了大廠之外,AI 創(chuàng)業(yè)者也已經(jīng)放棄打造更強(qiáng) AI 模型的想法,轉(zhuǎn)而開始利用現(xiàn)有 AI 模型的能力來提供 AI 視頻、AI 生圖、AI 代碼等服務(wù)。恰好谷歌的 TPUv5p 在推理任務(wù)中支持混合精度,可以很好地平衡精度與速度,更適用于提供推理算力。

      所以雖然在 CUDA 生態(tài)的加持下,英偉達(dá) GPU 在 AI 訓(xùn)練上無人能敵,可偏偏 DeepSeek 戳破了訓(xùn)練算力需求這個(gè)泡沫,就給了 OpenAI 實(shí)現(xiàn)算力供應(yīng)多元化的機(jī)會(huì)。其實(shí)這對于國內(nèi) AI 廠商來說也是一個(gè)好消息,畢竟英偉達(dá)在 CUDA 生態(tài)上的積累不是一朝一夕就能彎道超車的,但用 TPU 代替 GPU 現(xiàn)階段更有可行性。

      【本文圖片來自網(wǎng)絡(luò)】

      相關(guān)標(biāo)簽

      相關(guān)閱讀

      最新評(píng)論

      沒有更多評(píng)論了