文 | 新眸,作者 | 簡瑜
在 GPT-4 發(fā)布兩年之后,經(jīng)歷多次 " 跳票 " 的 GPT-5 終于在今日登場(chǎng)。
北京時(shí)間 8 月 8 日凌晨 1 點(diǎn),OpenAI 舉辦了一場(chǎng)超過一小時(shí)的發(fā)布會(huì),系統(tǒng)展示了 GPT-5 在智能水平、編程能力、任務(wù)推理等維度的性能迭代。
但相比此前 GPT-3 到 GPT-4 所帶來的全方位升級(jí),許多人表示,這次 GPT-5 并沒有帶來更多的驚喜,從發(fā)布會(huì)規(guī)模、產(chǎn)品亮點(diǎn)、到性能升級(jí),都顯得較為平庸,相較當(dāng)前主流 SOTA 模型,提升幅度并不顯著。
反倒是價(jià)格策略成了此次發(fā)布的最大亮點(diǎn)。GPT-5 的 API 調(diào)用價(jià)格僅為前幾日發(fā)布的 Claude Opus 4.1 的 1/15,顯著低于 Gemini 2.5 Pro,在當(dāng)前大模型市場(chǎng)上展現(xiàn)出極強(qiáng)的性價(jià)比。
近兩年,隨著 AI 工具開始席卷各行各業(yè),人們渴望 AI 能夠取代重復(fù)繁瑣的工作,也在擔(dān)憂自己是否會(huì)被 AI 所取代,這也是 GPT-5 發(fā)布前備受關(guān)注的原因之一。但就目前 GPT-5 的能力突破來看,人類智能在通往 AGI 的路上仍有很長一段路要走。
回顧過去幾年 GPT 的迭代歷程,不僅是眾多 AI 公司爭(zhēng)相效仿的對(duì)象,也是整個(gè)大模型行業(yè)發(fā)展的縮影。而此次 GPT-5 相對(duì)平庸的表現(xiàn),雖然打破了外界對(duì)大模型技術(shù)持續(xù)突破的慣性認(rèn)知,但某種程度上,也在大多數(shù)人的意料之中。
相比 AI 興起階段大眾對(duì)于大模型技術(shù)的過高展望,市場(chǎng)上有關(guān)大模型參數(shù)突破的討論正勢(shì)漸微弱。相比起技術(shù)突破,人們開始更加關(guān)心的是,AI 如何更有效地滲透進(jìn)日常生活。
從 GPT1 到 GPT5,GPT 的未來要走向哪里?
自 2018 年 OpenAI 發(fā)布首個(gè)大模型 GPT-1 以來,GPT 系列已經(jīng)走過了七年。
2020 年 GPT3 的出現(xiàn),讓大模型參數(shù)規(guī)模從 15 億直接拓展到了 1750 億,也因此通過 " 上下文學(xué)習(xí) " 能力,擺脫了對(duì)大量標(biāo)注數(shù)據(jù)的依賴,使大模型能夠開始作為效率工具使用。
兩年后,基于 GPT-3.5 構(gòu)建的對(duì)話式模型 ChatGPT 上線,進(jìn)一步推動(dòng)大模型走入 C 端日常,成為通用 AI 應(yīng)用的重要落地轉(zhuǎn)折點(diǎn)。
隨后 GPT-4 的全面升級(jí),更是在實(shí)現(xiàn)萬億級(jí)模型參數(shù)的同時(shí),讓大模型在單純文本輸出的基礎(chǔ)上,實(shí)現(xiàn)了圖像的交互提升。
此后一年里,GPT 發(fā)布的多款模型,都在圍繞圖像、語音互動(dòng)等多模態(tài)能力迭代; deepseek 的橫空出世,將推理模型帶向了大眾視野,去年 OpenAI 接連發(fā)布了 O1、O3 系列產(chǎn)品,將復(fù)雜推理作為了性能優(yōu)勢(shì),開始強(qiáng)調(diào)對(duì)科學(xué)、編程等專業(yè)領(lǐng)域的協(xié)助能力。
與此同時(shí),圍繞大模型參數(shù)量的宏大敘事開始逐漸消失,轉(zhuǎn)變?yōu)閷?duì)多模態(tài)、長文本等細(xì)節(jié)能力的追求,以及對(duì)醫(yī)療、教育等落地場(chǎng)景的討論。正因如此,大模型產(chǎn)品形態(tài)也開始從單一模型轉(zhuǎn)向了多版本并行。
截至目前,OpenAI 已構(gòu)建起由 GPT 系列(主打?qū)υ捊换ィ 系列(聚焦復(fù)雜推理)以及圖像 / 視頻生成模型(支撐多模態(tài)創(chuàng)作)組成的三大產(chǎn)品矩陣。
在本次升級(jí)的 GPT-5 中,GPT 進(jìn)一步統(tǒng)一了 O 系列的推理能力和 GPT 的快速響應(yīng),相比較 deepseek 在模型使用時(shí),自主選擇是否使用深度思考模式,GPT-5 的區(qū)別在于能夠自動(dòng)判斷對(duì)話類型。
除此之外,在此次發(fā)布會(huì)中,OpenAI 首次同時(shí)推出了 4 個(gè)版本,標(biāo)準(zhǔn)版 GPT-5、輕量級(jí)的 GPT-5 mini 與 GPT-5 nano,以及面向企業(yè)與高級(jí)訂閱用戶的 GPT-5 Pro(需企業(yè)授權(quán)或月付 200 美元)。加深了按需定制、分層定價(jià)的 SaaS 化路徑演進(jìn)。
這種轉(zhuǎn)變也意味著,對(duì)于 AI 公司來說,競(jìng)爭(zhēng)的門檻不再僅是技術(shù)突破,還在于是否具備構(gòu)建產(chǎn)品體驗(yàn)、搭建商業(yè)模型、整合跨界資源的綜合能力。
GPT-5 難產(chǎn)真相:大模型升級(jí)為何越來越難?
DeepSeek 上線所帶來的用戶量激增,不僅向外界證明了開源模型的商業(yè)化可行性,也進(jìn)一步加深了大模型公司對(duì) " 先發(fā)優(yōu)勢(shì) " 的重視。當(dāng)模型性能差距趨于收斂,前期對(duì)于用戶心智的爭(zhēng)奪上升為第一要義。
正因如此,隨著 GPT-5 問世的風(fēng)聲不斷,最近一段時(shí)間,各大廠商開始紛紛加速競(jìng)跑,相繼推出新品。
字節(jié)在兩個(gè)月前將豆包更新至 1.6 版本,阿里也在昨日推出了 Qwen3-4B-Instruct-2507 與 Thinking-2507 雙版本,MiniMax 近幾日發(fā)布了新一代語言生成模型 Speech 2.5,智譜也在上月底發(fā)布旗艦?zāi)P?GLM-4.5 ……一場(chǎng)集中式更新潮,給沉靜許久的大模型賽道掀起了又一波浪潮。
但當(dāng)我們把時(shí)間拉長來看,這波密集的模型上新趨勢(shì),距離上一次 " 百模大戰(zhàn) " 的盛景,已經(jīng)過去了一年多。
大模型的更新趨勢(shì)正在逐漸放緩。不僅如此,相較 GPT-3 到 GPT-4 參數(shù)暴漲、多模態(tài)突破、上下文顯著增強(qiáng)的躍遷,近期多款新品的提升幅度也顯得頗為有限,大多數(shù)模型的升級(jí)和 GPT-5 一樣乏善可陳。
很多人把背后的原因歸結(jié)為數(shù)據(jù)瓶頸。
去年萬眾矚目的 Orion,項(xiàng)目開發(fā)時(shí)長超過了 18 個(gè)月,曾經(jīng)被寄予厚望,原計(jì)劃作為 GPT-5 推出。結(jié)果在驗(yàn)證時(shí),性能卻遠(yuǎn)未達(dá)到預(yù)期,最終只能被降級(jí)成 GPT-4.5,在今年 2 月默默上線。
據(jù)業(yè)內(nèi)人士稱,Orion 之所以失敗,最核心的原因在于,團(tuán)隊(duì)摸到了預(yù)訓(xùn)練階段的天花板。隨著訓(xùn)練數(shù)據(jù)的不斷擴(kuò)充,高質(zhì)量網(wǎng)絡(luò)數(shù)據(jù)存量不斷減少,直接導(dǎo)致了模型訓(xùn)練效果的下降。
除此之外,隨著大模型參數(shù)量不斷增加,硬件水平所帶來的掣肘也在越發(fā)放大,據(jù)媒體報(bào)道,有開發(fā)人員透露,OpenAI 在去年年底所推出的推理模型 O3,之所以能夠?qū)崿F(xiàn)核心的性能提升,主要依賴于使用更多的英偉達(dá)芯片進(jìn)行開發(fā)。
更進(jìn)一步的問題在于,大眾對(duì)于 AI 幻覺、AI 味的抵制正在呈現(xiàn)更為激進(jìn)的態(tài)勢(shì)。
GPT-5 發(fā)布前夕,奧特曼曾在社交平臺(tái)分享了模型對(duì)話能力的演示。但出乎意料的是,評(píng)論區(qū)關(guān)注的焦點(diǎn)已不再是性能指標(biāo),而是 GPT 頻繁使用破折號(hào)的語言習(xí)慣。
此前 OpenAI 在今年 2 月推出的 GPT 4.5,核心性能升級(jí)也在于提升模型情商,減少 AI 痕跡。與此同時(shí),在有關(guān) GPT-5 的權(quán)威測(cè)評(píng)數(shù)據(jù)中,也表示出 AI 事實(shí)性幻覺的大幅減少。
但正如眾多網(wǎng)友所吐槽的那樣,相比較數(shù)學(xué)能力的準(zhǔn)確度提升,GPT-5 在寫作流暢度、情商表現(xiàn)上卻遠(yuǎn)不如 GPT 4.5。
某種程度上來說,AI 的思維機(jī)制和生成原理,注定了 " 事實(shí)性幻覺 " 始終是一種概率性存在。
Meta 首席 AI 科學(xué)家楊立昆曾經(jīng)對(duì)當(dāng)前主流的 LLM 背后的自回歸模型表示質(zhì)疑,認(rèn)為其通過預(yù)測(cè)下一個(gè)詞來生成文本的模式,本質(zhì)上無法孕育出真正的智能。
這一判斷也對(duì)過去大模型訓(xùn)練逃不開的 Scaling Law 路線進(jìn)行了質(zhì)疑,即單純?cè)黾訁?shù)數(shù)量并不能使得 AI 更好的擬合人類智能。背后的原因在于,兩者在思維結(jié)構(gòu)上存在本質(zhì)不同,前者是從更大、更多的參數(shù)中,以最小的成本組織信息;而后者則為了在不確定中生存和繁衍,具有更強(qiáng)的冗余性和模糊性。
AI Agent 落地,大模型要讓位?
一直以來,圍繞 ChatGPT 的訂閱收費(fèi)、API 接口調(diào)用是 OpenAI 的重要盈利來源,但隨著今年 AI Agent 的大量涌現(xiàn),大模型公司的商業(yè)化重心,開始發(fā)生了遷移。
上半年,OpenAI 發(fā)布了兩款基于 ChatGPT 的 AI Agent,一是可以代替用戶操作瀏覽器,自主執(zhí)行任務(wù)的 Operator;二是可以輔助做深入研究,生成專業(yè)研究報(bào)告的 Deep Research。
據(jù) The Information 披露相關(guān)文件表示,OpenAI 已告知投資者,預(yù)計(jì)到 2025 年末,AI Agent 及其他新產(chǎn)品的合計(jì)銷售額將超越 ChatGPT。
與此同時(shí),對(duì)比去年全年 37 億美元的營收, OpenAI 預(yù)計(jì)今年的營收能達(dá)到 127 億美元,相比去年的營收估值足足增長了 2 倍以上。背后最重要的驅(qū)動(dòng)力之一,就是 AI Agent。
事實(shí)上,AI Agent 的商業(yè)化爆發(fā)并非 OpenAI 獨(dú)享。以輔助編程為核心的 "vibe coding" 編輯器 Cursor 便是典型代表。
憑借多行智能重構(gòu)、代碼自動(dòng)補(bǔ)全和代碼庫查詢等功能,Cursor 付費(fèi)用戶已超 36 萬,最新估值較年初激增三倍。與此同時(shí),曾引發(fā)全網(wǎng) " 賬號(hào)搶購 " 熱潮的 Manus,盡管被曝 " 出逃海外 ",依然反映出 AI Agent 在垂直細(xì)分領(lǐng)域的極高用戶粘性。
AI Agent 的興起,一方面得益于大模型底層性能的持續(xù)提升,另一方面則源自各垂直領(lǐng)域?qū)Χㄖ苹悄芄ぞ叩膭傂孕枨?。這種需求不僅使得 Agent 能夠更精準(zhǔn)、高效地服務(wù)專業(yè)場(chǎng)景,也催生了更強(qiáng)的用戶依賴。
但需要指出的是,AI Agent 在實(shí)際應(yīng)用中通常面臨更高的 Tokens 消耗,這對(duì)創(chuàng)業(yè)公司尤其是資金實(shí)力有限者而言是沉重的壓力。Manus 的 " 出逃 ",一定程度上折射出了初創(chuàng)團(tuán)隊(duì)在高成本運(yùn)維與現(xiàn)金流壓力下的兩難境地。
此外,AI Agent 本質(zhì)上是建立在大模型基座之上的 " 套殼 " 應(yīng)用,模型能力的天花板直接限制了 Agent 的性能上限。相較之下,OpenAI 等頭部大模型廠商在底層模型研發(fā)上擁有明顯優(yōu)勢(shì),也因此更具主導(dǎo)權(quán)和話語權(quán),這也解釋了為何它們不會(huì)放棄 AI Agent 的開發(fā)與布局。
由此可見,大模型商業(yè)化正加速向細(xì)分場(chǎng)景和專門化應(yīng)用遷移。另一個(gè)與之相佐證的趨勢(shì)在于,OpenAI 對(duì) " 大模型閉源 " 的保守態(tài)度開始出現(xiàn)了松動(dòng)。
在 GPT-5 發(fā)布前夕,OpenAI 時(shí)隔三年再次推出了兩款開源模型:gpt-oss-120b 和 gpt-oss-20b。這一動(dòng)作不僅被外界視作 GPT-5 發(fā)布前的技術(shù)熱身,也被認(rèn)為是在試圖回應(yīng)業(yè)界對(duì)模型開源日益高漲的呼聲。
與此同時(shí),GPT-5 調(diào)用價(jià)格也被進(jìn)一步拉低,僅為前幾日發(fā)布的 Claude Opus 4.1 的 1/15。當(dāng)模型迭代的平臺(tái)期和 Agent 商業(yè)化趨勢(shì)同時(shí)出現(xiàn),從 " 賣模型 " 轉(zhuǎn)向 " 賣能力 ",大模型公司的產(chǎn)品重心正在發(fā)生實(shí)質(zhì)性轉(zhuǎn)變。