文 | AI 大模型工場,作者|西梅汁,編輯|星奈
今年,被不少業(yè)內(nèi)人稱為 "Agent 元年 "。
這一年,AI Agent 的概念像一枚火種,從初創(chuàng)公司 Manus 的 Demo 視頻點(diǎn)燃,到字節(jié)跳動用 " 扣子空間 " 將 Agent 化身為 " 裂變工具 ",嵌入日常場景;百度 " 心響 " 定位通用超級智能體 APP,覆蓋 200+ 任務(wù)類型,試圖實(shí)現(xiàn)復(fù)雜任務(wù)的一站式解決;阿里的 " 心流 " 項(xiàng)目則深入研究 Agent 的人機(jī)協(xié)同效率,從電商客服到企業(yè)服務(wù)逐步鋪展;騰訊繼續(xù)秉持平臺戰(zhàn)略,構(gòu)建 Agent 開發(fā)生態(tài)。
與此同時,融資市場也被點(diǎn)燃。據(jù)來覓 PEVC 數(shù)據(jù),自 2024 年以來,全球 AI Agent 賽道的融資金額已突破 665 億元人民幣。其中,自動駕駛、人形機(jī)器人、大模型等賽道最吸金,頭部機(jī)構(gòu)頻頻下注。
但如同幾乎每一場 AI 浪潮一樣,泡沫的陰影也在快速靠近。
技術(shù)的躍遷是否足夠支撐其野心勃勃的應(yīng)用想象?用戶真有 " 剛需 " 到愿意持續(xù)留存并為之付費(fèi)?這場由巨頭領(lǐng)舞的盛宴,究竟是邁向 AI 大規(guī)模落地的新起點(diǎn),還是又一輪概念堆疊下的虛火?
一、Agent 何以成為巨頭必爭之地?
在國內(nèi)大模型發(fā)展逐步穩(wěn)定、通用對話功能趨同的背景下,Agent 像是被視作 " 后提示詞時代 " 的新概念。它以任務(wù)導(dǎo)向、自主規(guī)劃和多步驟執(zhí)行為特征,為模型的可用性打開了新空間。
過去,用戶需要靠提示詞技巧與模型反復(fù)周旋,而現(xiàn)在,Agent 可在給定目標(biāo)下自動執(zhí)行一系列動作,更符合大家對 "AI 助理 " 的直覺期待。
Manus 的出圈并非偶然,它采用多智能體系統(tǒng)架構(gòu),能動態(tài)調(diào)用不同領(lǐng)域的專用大模型,實(shí)現(xiàn) "1+1>2" 的效果。這就有點(diǎn)像交響樂團(tuán)的指揮,協(xié)調(diào)各個樂器組,讓它們共同演奏音樂,不僅避免了單一模型在能力上的局限性,還有效提升了任務(wù)處理的能力和效率。
大廠也迅速響應(yīng),尤其在內(nèi)容、辦公、知識管理等相對標(biāo)準(zhǔn)化的應(yīng)用領(lǐng)域推進(jìn) Agent 化轉(zhuǎn)型。
字節(jié) " 扣子空間 " 聚焦創(chuàng)作者自動剪輯與內(nèi)容發(fā)布,百度借 " 心響 " 深耕搜索與問答任務(wù)鏈,阿里探索電商、客服、財(cái)務(wù)等垂直系統(tǒng)嵌入,騰訊則將 Agent 能力集成至企業(yè)微信、騰訊文檔、混元平臺 API 中,意在形成多層級的企業(yè)服務(wù)生態(tài)。
在這些探索背后,是國內(nèi) AI 產(chǎn)業(yè)對 " 大模型 + 場景 " 的現(xiàn)實(shí)需求。同時,更重視端到端的體驗(yàn)。Agent 不僅是界面重構(gòu),更被視為商業(yè)模型升級的關(guān)鍵跳板。
Agent 的爆發(fā),并非偶然,它在多個層面踩中了時代的脈搏。
從技術(shù)演進(jìn)來看,大模型能力的提升為 Agent 提供了基礎(chǔ)算力保障。GPT-4 之后,無論是語言理解上,還是多模態(tài)能力上,都達(dá)到了一個足以支撐復(fù)雜任務(wù)調(diào)度的門檻。
其次是交互方式的進(jìn)化。在語音助手、聊天機(jī)器人之后,Agent 的出現(xiàn)提供了一個更具沉浸感與目的性的交互路徑。不僅回應(yīng)用戶的問題,更主動推進(jìn)任務(wù)流程。相比于過去 " 你問我答 " 的工具形態(tài),Agent 承諾的是 " 交付結(jié)果 " 的服務(wù)形態(tài)。
同時,對巨頭而言,這是一道無法繞開的必答題。過去兩年,大模型技術(shù)已經(jīng)趨于 " 共識化 ",能力邊際變小、差異化成本變高," 百模大戰(zhàn) " 的價格戰(zhàn)和性能戰(zhàn)耗盡了耐心。
而 Agent 像是一條新通道,它不僅能撬動新應(yīng)用,還可能打開存量業(yè)務(wù)的變現(xiàn)瓶頸。更關(guān)鍵的是,它落地的單位顆粒度小,可以快速試錯、快速迭代、快速驗(yàn)證商業(yè)價值。
Agent,似乎成為了下一階段 " 技術(shù)找場景 " 的試金石。
二、繁榮下的 AB 面:技術(shù)突破還是 " 高級自動化 "?
但是在這股熱潮之下,并非沒有質(zhì)疑。
華麗演示背后往往忽略場景條件和人工干預(yù)。許多 " 自助手寫文章 " 或 " 自動化辦公 " 案例,前提是有精心編寫的提示詞、可靠的網(wǎng)絡(luò)資源和大量 API。
實(shí)際部署時,Agent 需要解決環(huán)境不穩(wěn)定、異常處理和及時糾錯等問題。不少技術(shù)人士指出,目前絕大多數(shù) Agent 產(chǎn)品,距離真正的 " 智能體 " 尚有不小差距。路徑規(guī)劃、工具調(diào)用、多輪交互確實(shí)比傳統(tǒng)對話系統(tǒng)更進(jìn)了一步,但核心邏輯仍是任務(wù)自動化的增強(qiáng)版。
換句話說,許多所謂 Agent,更像是 " 流程機(jī)器人 " 套了一個 AI 殼。也就是說,真實(shí)場景中的連續(xù)任務(wù)與演示環(huán)境相差甚遠(yuǎn),常常需要人工 " 監(jiān)督 + 修正 ",效率提升有限。
從技術(shù)底座看,Agent 的運(yùn)行強(qiáng)依賴于幾個關(guān)鍵環(huán)節(jié):環(huán)境建模、記憶系統(tǒng)、長期目標(biāo)拆解能力、多模態(tài)融合、對接工具鏈的穩(wěn)定性等。遺憾的是,這些環(huán)節(jié)沒有一個是完全 " 成熟 " 的。
而從用戶體驗(yàn)出發(fā),Agent 帶來的改變,往往不如想象中 " 革命性 "。大家仍需學(xué)習(xí)如何 " 正確地 " 提示 Agent,才能獲得理想結(jié)果;不少產(chǎn)品陷入 " 體驗(yàn)上像是套殼 Siri,底層上是復(fù)雜 Prompt 拼貼 " 的窘境。更有甚者,在以 " 聰明感 " 吸引用戶的同時,背后的調(diào)度邏輯與 "AI" 關(guān)聯(lián)甚微,幾乎只是流水線式腳本執(zhí)行。
換言之,Agent 確實(shí)比傳統(tǒng) Bot 更強(qiáng)大,但要說它已經(jīng)構(gòu)成 " 生產(chǎn)力革命 " 的新轉(zhuǎn)折,仍言之過早。
那么在面對這些挑戰(zhàn),創(chuàng)業(yè)公司和大廠分別采取了不同策略。以 Manus 為代表的新銳隊(duì)伍,傾向于前沿探索,它們往往開放注冊早期用戶,依托最新架構(gòu)集成 API 插件,追求功能極限。
Manus 自身就號稱 " 多模型架構(gòu) + 后臺實(shí)時監(jiān)控 + 可回放會話 ",試圖給用戶提供一個 " 看得見、可操控 " 的 Agent。但事實(shí)上,部分用戶社區(qū)評論已經(jīng)質(zhì)疑其穩(wěn)定性,稱有部分功能只是包裝,很多操作依賴已有大模型或手動準(zhǔn)備的工具。
相比之下,字節(jié)、百度等大廠則走更穩(wěn)健的路徑,它們往往先將 Agent 功能融入已有產(chǎn)品(像智能客服、辦公軟件),以部件化插件形式提供服務(wù),同時還在內(nèi)部持續(xù)打磨系統(tǒng)。
如百度推出的 " 鏈路學(xué)習(xí) " 場景、騰訊開放的企業(yè)辦公助手等,更多強(qiáng)調(diào)閉環(huán)業(yè)務(wù)與安全控制。大廠有資源建立大規(guī)模測試和安全審查,因此在落地前強(qiáng)調(diào)可控性和行業(yè)適應(yīng)度,而不是一味追求技術(shù)。
總的來說,Agent 在概念層面吸引了眾多目光,但其技術(shù)短板同樣顯而易見,記憶與上下文管理不足、多任務(wù)泛化困難、對動態(tài)環(huán)境的感知不強(qiáng)、對結(jié)果的可靠性缺乏保證等等。Manus 等創(chuàng)業(yè)者的嘗試激發(fā)了想象,但是否可持續(xù)盈利和規(guī)模化,還有待進(jìn)一步探索。
三、巨頭混戰(zhàn):戰(zhàn)略卡位與差異化求生
不同的巨頭,在 Agent 賽道上有著完全不同的下注策略,但它們的底層意圖卻高度一致:以 Agent 為抓手,構(gòu)建出人與產(chǎn)品、人與服務(wù)、人與平臺之間的關(guān)系。
從時間上看,字節(jié)是幾家巨頭中最早高調(diào)入場 Agent 概念的玩家。早在 2023 年底,字節(jié)就上線了豆包智能體平臺,主張 " 人人都能造 Agent"。
到 2024 年初,其推出的 " 扣子 " 平臺進(jìn)一步降低了智能體開發(fā)的門檻,通過可視化流程、拖拽組件、內(nèi)置插件等方式,讓非技術(shù)背景的個人也能創(chuàng)建功能豐富的智能體,并一鍵發(fā)布至豆包、飛書、抖音等多個渠道。
" 扣子 " 本質(zhì)上是一個智能體應(yīng)用廣場,它整合了插件系統(tǒng)、工作流引擎、知識庫接入和多端發(fā)布等能力。據(jù) 2024 年 12 月消息,扣子專業(yè)版集成了 1 萬 + 插件,可調(diào)用國內(nèi)流行的大語言模型,且扣子 1.5 版本還集成了視覺理解、音樂、圖像生成等模型。
不僅如此,據(jù)公開數(shù)據(jù)統(tǒng)計(jì),截至 2025 年第一季度,豆包平臺上已上線智能體超過 10 萬個,其中大部分來自個人開發(fā)者和中小企業(yè),體現(xiàn)出較強(qiáng)的生態(tài)活力。在產(chǎn)品邏輯上,字節(jié)試圖延續(xù)其內(nèi)容平臺的成功經(jīng)驗(yàn),通過低門檻創(chuàng)作工具和算法分發(fā)機(jī)制,激發(fā)長尾智能體的活躍度。
雖然 Agent 的交互屬性與內(nèi)容消費(fèi)不同,但這種平臺化打法在推動生態(tài)建設(shè)、吸引開發(fā)者上具備一定先發(fā)優(yōu)勢。
騰訊在 Agent 方向的布局體現(xiàn)出 " 平臺 + 能力 " 的戰(zhàn)略思路。自 2024 年底起,大模型相關(guān)業(yè)務(wù)統(tǒng)一劃歸至 CSIG,Agent 被正式納入騰訊云的大模型戰(zhàn)略,成為核心落地方向。當(dāng)前已形成雙平臺體系:面向 C 端用戶與輕量開發(fā)者的 " 元器 ",以及服務(wù)企業(yè)級需求的 " 騰訊云智能體開發(fā)平臺 ",分別覆蓋內(nèi)容創(chuàng)作與業(yè)務(wù)重構(gòu)兩大場景。
在實(shí)際產(chǎn)品落地上,騰訊正在拓展 Agent 的行為邊界。前段時間,推出的 Qbot 瀏覽器,具備文件轉(zhuǎn)換、應(yīng)用操作等能力,未來可望與本地軟件打通,成為用戶常駐的多功能助手。
當(dāng)前的挑戰(zhàn)來看,模型自主性仍待提升,復(fù)雜任務(wù)的拆解執(zhí)行仍需框架與工程體系配合,客戶對 Agent 的認(rèn)知也需要通過多種方式彌合。
阿里在 Agent 方向的思路,延續(xù)了其在企業(yè)服務(wù)領(lǐng)域的深耕路徑。自 2023 年起,釘釘就開始試點(diǎn)智能助理功能,2024 年進(jìn)一步升級為 "AI 助理中心 ",并在 2025 年開放智能體開發(fā)框架,支持企業(yè)定制自己的數(shù)字員工。其核心優(yōu)勢在于:緊貼企業(yè)實(shí)際需求,強(qiáng)調(diào)數(shù)據(jù)私有、安全可信、系統(tǒng)兼容。
在技術(shù)研發(fā)上,阿里云的通義千問 Qwen 系列大模型為 Agent 應(yīng)用提供了強(qiáng)大的基礎(chǔ)能力,還開源 Qwen - Agent 框架及多個 Agent 應(yīng)用示例,降低開發(fā)門檻,并融入多模態(tài)技術(shù)豐富交互體驗(yàn)。
今年 3 月,夸克 App 推出了 AI 版,并首創(chuàng)了 " 智能體中樞 " 功能,將其轉(zhuǎn)型為多模態(tài) Agent 平臺,用戶通過該平臺可以直接獲取 AI 所執(zhí)行的任務(wù)結(jié)果,而不僅僅是傳統(tǒng)的搜索或聊天。4 月,阿里又推出了 " 心流 " 智能體應(yīng)用,通過高級研究模式幫助用戶自動完成報(bào)告編寫、代碼生成等復(fù)雜任務(wù)。此外還在外貿(mào)、智能客服等領(lǐng)域推出多種 Agent 應(yīng)用。
百度作為最早布局大模型的公司之一,在 Agent 方向的探索也在持續(xù)推進(jìn)。在 create2025 百度 AI 開發(fā)者大會上,推出了 " 心響 "APP,是一款以 "AI 任務(wù)完成引擎 " 為核心的通用超級智能體 APP,致力于通過智能化手段解決用戶日常生活中的復(fù)雜需求。已經(jīng)覆蓋了 200 多個任務(wù)類型,未來計(jì)劃擴(kuò)展至 10 萬種以上。
同時,百度的文心智能體平臺為零代碼基礎(chǔ)的用戶提供了全鏈路的任務(wù)創(chuàng)作與經(jīng)營服務(wù),支持海量工具調(diào)用,推動了 Agent 生態(tài)的不斷發(fā)展。
同時,百度全面擁抱 MCP 協(xié)議,將這一協(xié)議應(yīng)用于文心大模型、千帆平臺及核心產(chǎn)品,如百度搜索和百度文庫等。這一協(xié)議使得 AI 應(yīng)用與外部世界的連接更加緊密,進(jìn)一步提升了 Agent 在任務(wù)規(guī)劃和調(diào)度中的精確度與效率。此外,百度還發(fā)布了文心大模型 4.5 Turbo 和 X1 Turbo,為優(yōu)化任務(wù)執(zhí)行的速度、性能和性價比,推動 Agent 技術(shù)的持續(xù)進(jìn)步。
不僅如此,百度通過智能云千帆平臺,為企業(yè)提供全面的 MCP 支持,鼓勵開發(fā)者在平臺上開發(fā)自己的 MCP 組件并與外部業(yè)務(wù)系統(tǒng)對接,推動 MCP 生態(tài)的繁榮。
總體來看,Agent 并非一個孤立的技術(shù)標(biāo)簽,而是模型能力、應(yīng)用框架與用戶需求三者交匯的產(chǎn)物。隨著大模型差異化逐步縮小,各家企業(yè)在 Agent 上的布局也反映出各自的生態(tài)定位與資源。
字節(jié)強(qiáng)調(diào)內(nèi)容驅(qū)動與生態(tài)構(gòu)建,騰訊重視能力組件與業(yè)務(wù)整合,阿里深耕產(chǎn)業(yè)落地與定制化服務(wù),百度則以產(chǎn)品閉環(huán)和底層模型為基石。
這場 Agent 競速沒有明確的終點(diǎn),它更像是大模型商業(yè)化的一場階段性演進(jìn)。
四、真未來還是新泡沫?
Agent 的確具備塑造未來產(chǎn)品形態(tài)的潛力,它融合了模型能力、交互邏輯與任務(wù)調(diào)度,使 AI 從 " 回答者 " 進(jìn)化為 " 行動者 "。但在通往未來的路上,每一個技術(shù)熱點(diǎn)都難免遭遇泡沫期的 " 高估—失望—再估值 " 周期。
今天的 Agent 熱,既是技術(shù)突破的階段性結(jié)果,也裹挾著巨頭對增長焦慮的投射。資本、流量、研發(fā)資源的傾斜,使其呈現(xiàn)出 " 預(yù)期大于現(xiàn)實(shí) " 的膨脹狀態(tài)。那些缺乏穩(wěn)定場景支撐、無法形成用戶復(fù)購的 Agent 應(yīng)用,很可能會在下一輪融資窗口關(guān)閉時迅速退潮。
但這并不意味著泡沫本身是壞事。技術(shù)演進(jìn)從不可能一帆風(fēng)順,泡沫是篩選機(jī)制,更是催化劑。真正的問題在于:誰能在熱潮退卻后留下可復(fù)用的底層架構(gòu)與產(chǎn)品模型?誰能真正找到場景契合、用戶愿意長期使用的價值點(diǎn)?
Agent 不會是終點(diǎn),它更像是一塊通向下一階段 AI 生態(tài)的跳板。問題不在于它 " 是不是泡沫 ",而是誰能在泡沫散去之后,站在原地繼續(xù)前行。