中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      鈦媒體 昨天

      2025 智駕 “大逃殺”,誰(shuí)會(huì)被 VLA “絞殺”?

      文 | 最話(huà) FunTalk,作者 | 林書(shū),編輯 | 劉宇翔

      2025 年 8 月的最后一個(gè)星期,中國(guó)智能駕駛被驟然按下快進(jìn)鍵——從算法底座到整車(chē) OTA,行業(yè)在短短幾天內(nèi),呈現(xiàn)出了 "VLA 齊爆發(fā) " 的景觀(guān)。

      VLA,即 Vision-Language-Action,視覺(jué) - 語(yǔ)言 - 行動(dòng)模型。VLA 的快速商業(yè)化落地,正在重新定義 " 高階智駕 " 的技術(shù)門(mén)檻。

      首先是理想汽車(chē)借純電旗艦 i8 上市窗口,首次向全量用戶(hù)推送「VLA 司機(jī)大模型」;元戎啟行于 8 月 26 日正式發(fā)布自研 VLA 大模型,推出名為 DeepRoute IO 2.0 的新平臺(tái),確定將在 5 款車(chē)型上使用,覆蓋累計(jì)約 20 萬(wàn)臺(tái)車(chē)。

      緊接著,小鵬汽車(chē)在 8 月 27 日的新 P7 發(fā)布會(huì)上端出新一代 VLA 架構(gòu),宣稱(chēng)時(shí)延

      與此同時(shí),華為代表的另一大路線(xiàn)—— WA ( 世界行為模型 ) ,也正在緊密地醞釀中。ADS 4.0 將在 9 月隨問(wèn)界 M9 年度改款 OTA,試圖重新劃定城區(qū)智駕的體驗(yàn)基線(xiàn)。

      之所以 "VLA 上車(chē)潮 " 發(fā)生在 2025 年,從商業(yè)的角度來(lái)看,是因?yàn)榻衲晏幱诔鞘?NOA 規(guī)?;桓叮↙2++)與 Robotaxi 商業(yè)化(L4)之間的 " 空檔期 "。誰(shuí)先完成 VLA 量產(chǎn),誰(shuí)就能在下一階段用戶(hù)體驗(yàn)與融資敘事上占據(jù)先手,錯(cuò)過(guò) 2025,技術(shù)紅利將被稀釋?zhuān)杀緝?yōu)勢(shì)也將被供應(yīng)鏈攤平。

      VLA 掀起的新一輪競(jìng)爭(zhēng),不僅將決定中國(guó)車(chē)企的未來(lái)競(jìng)爭(zhēng)地位,更可能引發(fā)整個(gè)智駕產(chǎn)業(yè)的重新洗牌。

      新的門(mén)檻

      如果要對(duì) VLA 路線(xiàn)的技術(shù)優(yōu)勢(shì),做一個(gè)簡(jiǎn)單的概述,這樣的優(yōu)勢(shì)大致就是:

      與傳統(tǒng)端到端路線(xiàn)相比,VLA通過(guò)用語(yǔ)言和文字這一中間環(huán)節(jié),將具象化的路況、圖像,進(jìn)行歸類(lèi),并進(jìn)行"抽象化",而不只是單純地對(duì)看過(guò)的數(shù)據(jù)"死記硬背",從而讓模型能取得更好的泛化能力。

      同時(shí),在具備思維鏈(CoT)能力后,VLA 模型能分解駕駛決策為邏輯連貫的中間步驟,增強(qiáng)決策邏輯性、系統(tǒng)可解釋性及泛化能力。

      當(dāng)人類(lèi)駕駛員面對(duì)突發(fā)路況時(shí),會(huì)本能地完成 " 觀(guān)察→判斷→動(dòng)作 " 的連貫認(rèn)知過(guò)程。

      VLA(視覺(jué) - 語(yǔ)言 - 動(dòng)作模型)正是通過(guò)模擬這一邏輯,構(gòu)建起 " 視覺(jué)感知 - 語(yǔ)言推理 - 動(dòng)作輸出 " 的閉環(huán)系統(tǒng),實(shí)現(xiàn)對(duì)幾十秒長(zhǎng)時(shí)序路況的預(yù)判能力,尤其在施工路段等長(zhǎng)尾場(chǎng)景中展現(xiàn)出更強(qiáng)的泛化能力。

      然而,由于多了 " 語(yǔ)言 " 這一層數(shù)據(jù),VLA 對(duì)算力與數(shù)據(jù)的胃口,已把 " 上車(chē) " 門(mén)檻抬高到傳統(tǒng)方案無(wú)法企及的高度。算力側(cè),訓(xùn)練端需吞吐 22 T token 級(jí)多模態(tài)數(shù)據(jù),單次訓(xùn)練即等價(jià)于 DeepSeek-V3 1.5 倍規(guī)模;

      數(shù)據(jù)側(cè),VLA 需同步采集并標(biāo)注視覺(jué) - 語(yǔ)言 - 動(dòng)作三元組,理想訓(xùn)練所用的數(shù)據(jù),90 % 來(lái)自 29.3 億 km 實(shí)車(chē)日志,10 % 由生成式仿真補(bǔ)足,長(zhǎng)尾極端場(chǎng)景(雨夜、施工、異形障礙物)需額外 5-10 倍數(shù)據(jù)密度才能收斂,導(dǎo)致單車(chē)數(shù)據(jù)成本與端到端時(shí)代相比陡然增加。

      在算力方面,理想、小鵬分別動(dòng)用 13 EFLOPS 與 8 EFLOPS 云端集群,僅千卡周級(jí)調(diào)度才能滿(mǎn)足 30 B-72 B 參數(shù)模型的收斂窗口。公開(kāi)數(shù)據(jù)顯示,國(guó)內(nèi)中小車(chē)企云端訓(xùn)練集群普遍停留在 0.2 – 0.6 EFLOPS,僅為理想 5.39 EFLOPS 的十分之一,更遑論特斯拉 Dojo 年底 100 EFLOPS 的量級(jí)。

      以哪吒為例,其烏蘭察布 GPU 集群峰值 180 PFLOPS,尚不足以在 30 天內(nèi)完成一次 7 B 參數(shù) VLA 模型收斂;若租用公有云,按當(dāng)前 A100/H100 現(xiàn)貨價(jià)折算,單次訓(xùn)練即需 1.2 – 1.5 億元人民幣,相當(dāng)于其 2024 年全年研發(fā)預(yù)算的 40 %。

      這意味著,VLA 的量產(chǎn)落地是 " 千卡訓(xùn)練云+千 TOPS 車(chē)端+千億級(jí)數(shù)據(jù) " 三線(xiàn)并進(jìn)的極限工程,任何一環(huán)缺口都會(huì)把 ROI 拉成負(fù)值。

      對(duì)于年銷(xiāo)量?jī)H十余萬(wàn)輛的中小車(chē)企而言,如此高昂的投入難以通過(guò)規(guī)?;瘮偙?,且失敗風(fēng)險(xiǎn)高企。正如元戎啟行 CEO 周光指出,一家智駕公司需交付 10 萬(wàn)輛級(jí)量產(chǎn)車(chē),才具備搭建 VLA 架構(gòu)的基本數(shù)據(jù)基礎(chǔ)。

      更重要的是,從規(guī)則時(shí)代到 VLA 的躍遷并不是一次可折疊的跨越,而是一段必須在工程實(shí)踐中逐級(jí) " 淬火 " 的鏈?zhǔn)椒磻?yīng)。

      行業(yè)洗牌

      在 VLA 路線(xiàn)所需的高昂成本面前,中小車(chē)企面臨的生存困境愈發(fā)明顯,除了算力與數(shù)據(jù)方面的差距外,從規(guī)則時(shí)代到端到端 1.0 積累的先發(fā)優(yōu)勢(shì)構(gòu)建的技術(shù)護(hù)城河,也是多數(shù)二線(xiàn)品牌難以復(fù)現(xiàn)的關(guān)鍵環(huán)節(jié)。

      最初,規(guī)則算法用顯式代碼與人工先驗(yàn),把駕駛?cè)蝿?wù)拆解為可驗(yàn)證的模塊,給團(tuán)隊(duì)留下可解釋、可追責(zé)的體系化思維與場(chǎng)景分類(lèi)框架;

      進(jìn)入端到端 1.0 后,系統(tǒng)首次用大規(guī)模標(biāo)注數(shù)據(jù)替代人工規(guī)則,逼迫組織完成數(shù)據(jù)閉環(huán)、工具鏈、DevOps 的原始積累,同時(shí)暴露出長(zhǎng)尾場(chǎng)景對(duì)數(shù)據(jù)密度的極端需求;

      最終在邁向 VLA 時(shí),團(tuán)隊(duì)需要把前兩階段沉淀的工程學(xué)積累整體遷移到新框架里,才能形成 " 視覺(jué)—語(yǔ)言—行動(dòng) " 的高度統(tǒng)一。

      理想汽車(chē)?yán)钕胍苍毖?,若企業(yè)連規(guī)則算法都做不好,則根本無(wú)從知曉如何訓(xùn)練 VLA 模型。

      在這樣的差距下,VLA 路線(xiàn)的降臨,無(wú)疑會(huì)讓行業(yè)迎來(lái)一次 " 大洗牌 "。中低端車(chē)企、品牌,要么難以在新時(shí)代生存,要么只能淪為 " 方案外購(gòu)者 ",或成為車(chē)企的富士康 ",成為低端代工,利潤(rùn)被芯片廠(chǎng)和算法公司兩頭吃。

      在端到端 1.0 時(shí)代,雖然絕大多數(shù)中低端車(chē)在 " 數(shù)據(jù) - 模型 - 芯片 " 三件套中,極少能完全自研,本質(zhì)上是 " 拼積木 " 式集成。

      但過(guò)去車(chē)企可以掏錢(qián)買(mǎi) Orin、買(mǎi)算法、買(mǎi)標(biāo)注,大家都能活得不錯(cuò)。

      例如哪吒、零跑、寶駿等普遍采用英偉達(dá) Orin-X 或地平線(xiàn)征程 5 的 " 公版域控 ";數(shù)據(jù)方面,零跑 C10 的 2.1 億公里有效里程中,60 % 標(biāo)注任務(wù)由 Momenta、覺(jué)非科技完成;

      但是到了端到端 2.0 時(shí)代," 外包式生存 " 在 2.0 時(shí)代被上游供應(yīng)商自己 " 關(guān)門(mén) " 了——由于 VLA 路線(xiàn)導(dǎo)致的算力、數(shù)據(jù)成本驟增,現(xiàn)在這三樣變成了 " 限量款 ",而且限量權(quán)掌握在極少數(shù)巨頭手里。

      例如英偉達(dá)今年首批 Thor-U 的 40 萬(wàn)片產(chǎn)能,早已被理想、蔚來(lái)、小鵬在 2024 年就簽完長(zhǎng)期鎖價(jià)鎖量協(xié)議,拿走 32 萬(wàn)片,只留 8 萬(wàn)片現(xiàn)貨需要溢價(jià) 30 % 競(jìng)拍。

      原本 " 誰(shuí)掏錢(qián)誰(shuí)就能買(mǎi)到 " 的開(kāi)放供應(yīng)鏈,在 2025 年因?yàn)樾酒必洝⒛P图軜?gòu)改變導(dǎo)致的算法改捆綁、被壓縮成 " 少數(shù)玩家內(nèi)部閉環(huán) ",中小車(chē)企連 " 買(mǎi)方案 " 這條退路都被截?cái)唷?/p>

      再此情況下,中小車(chē)企面臨的生存困境愈發(fā)明顯,當(dāng)頭部企業(yè)通過(guò) " 芯片 - 數(shù)據(jù) - 模型 " 的閉環(huán)能力構(gòu)建起技術(shù)壁壘時(shí),中小車(chē)企便陷入一個(gè)死循環(huán):買(mǎi)芯片沒(méi)配額,買(mǎi)模型要持續(xù)分成,攢數(shù)據(jù)沒(méi)錢(qián)也沒(méi)人。

      中小車(chē)企唯一還能做的,就是融入供應(yīng)鏈,把整車(chē)制造、沖壓焊接、總裝測(cè)試這些傳統(tǒng)環(huán)節(jié)做到極致良率和極致成本——這正是富士康在手機(jī)行業(yè)扮演的角色。

      頭部之變

      盡管現(xiàn)在的 VLA 模型十分火熱,但在智駕方面,并不是所有車(chē)企都認(rèn)可這一路線(xiàn)。

      除了 VLA 路線(xiàn),目前華為和蔚來(lái)主推的是另一條路線(xiàn):世界模型(WA)。其核心思路,是 " 海量使用云端模擬的數(shù)據(jù)、來(lái)讓大模型‘理解’世界而學(xué)會(huì)駕駛 "。

      例如華為的 World Action Model 模型(WA),用擴(kuò)散生成模型批量 " 造 "Corner case,

      也就是通過(guò) AI 生成的大量的視頻案例,來(lái)讓模型明白何為物理規(guī)則。

      而蔚來(lái)的 NIO World Model(NWM),則通過(guò)將激光雷達(dá) + 視覺(jué)壓縮成 3D token;再通過(guò)自回歸模型一次推演 5 秒后的多幀場(chǎng)景,從而 " 想象 " 出從未見(jiàn)過(guò)的路況。

      而 WA 與 VLA 兩條路線(xiàn)的區(qū)別,或許可以概述為:世界模型是 " 理想主義的未來(lái)豪賭 ",VLA 是 " 實(shí)用主義的當(dāng)下生存 "。

      但在華為看來(lái),語(yǔ)言模型擅長(zhǎng)文本推理,卻缺乏對(duì)三維空間的精確感知與運(yùn)動(dòng)推演能力。

      而車(chē),畢竟是在真實(shí)空間中運(yùn)動(dòng)的物體,毫厘之差可能就意味著風(fēng)險(xiǎn)。

      唯有讓模型真正理解物理規(guī)則,才能從根本上解決端到端模型 " 只會(huì)模仿、不會(huì)思考 " 的瓶頸。

      但盡管世界模型看上去更 " 終極 ",但 VLA 這條更 " 務(wù)實(shí) " 的路線(xiàn),對(duì)理想、小鵬等車(chē)企來(lái)說(shuō),仍然有著 " 改命 " 的意義。

      一方面,2024 年理想以 50 萬(wàn)輛交付量登頂新勢(shì)力,但單車(chē)毛利率從 21.5% 下滑至 19.8%,增程市場(chǎng)被華為、蔚來(lái)、小鵬全面圍剿(如華為問(wèn)界 M8、蔚來(lái)樂(lè)道直指 L7/L8)。對(duì)理想來(lái)說(shuō),冰箱彩電大沙發(fā)已不再亮眼,必須用智能化重新定義產(chǎn)品。

      而小鵬目前在純電市場(chǎng)追趕比亞迪、特斯拉,其正在推進(jìn)的機(jī)器人也需要通用 AI 基座。小鵬選擇 VLA 混合架構(gòu),本質(zhì)是 " 一箭雙雕 ":其 72B 云端基座模型,本質(zhì)是 VLA 的超大型版本,既服務(wù)汽車(chē),也為將來(lái)的機(jī)器人鋪路。

      對(duì)二者來(lái)說(shuō),VLA 是 " 唯一能把長(zhǎng)尾一口氣吃掉 " 的可行框架,并且,理想、小鵬積累的數(shù)據(jù)密度已經(jīng)足夠讓 VLA 越過(guò) " 冷啟動(dòng)死亡谷 ",這是后來(lái)者無(wú)法復(fù)制的壁壘。

      從市場(chǎng)的角度看,雖然華為與 Momenta 已占據(jù) 2025 年智駕市場(chǎng) 90% 份額。這樣的雙寡頭地位難以撼動(dòng)。且華為現(xiàn)在的智駕地位,靠的不是單模型大小、強(qiáng)弱,而是 " 數(shù)據(jù) + 軟硬一體 + 車(chē)廠(chǎng) " 綁定三位一體的護(hù)城河。

      然而,VLA 大模型的普及,會(huì)顯著改變競(jìng)爭(zhēng)格局,形成技術(shù)路線(xiàn)分化、市場(chǎng)份額重組。

      傳統(tǒng)智駕模型是:你給多少場(chǎng)景、多少樣本,模型就記住多少,每新增一個(gè)少見(jiàn)場(chǎng)景都得補(bǔ)數(shù)據(jù)。華為在這層面確實(shí)通過(guò)規(guī)模碾壓了競(jìng)爭(zhēng)對(duì)手。

      但是 VLA 模型不同。它的魔力在于多模態(tài)學(xué)習(xí)和推理能力——一方面通過(guò) " 視覺(jué) + 語(yǔ)言 + 行為 " 三種輸入,讓模型 " 理解 " 得更深刻,不只是記住,而是學(xué)會(huì)類(lèi)人推理;這使理想、小鵬等車(chē)企,在長(zhǎng)尾場(chǎng)景上也能獲得接近華為的表現(xiàn)。

      所以,在新一輪的智駕競(jìng)爭(zhēng)中,現(xiàn)有的格局不會(huì)立刻翻盤(pán),但 VLA 已經(jīng)打開(kāi)了一個(gè)新的窗口。

      可以說(shuō),隨著新一輪技術(shù)升級(jí)的到來(lái),中小車(chē)企的危局,以及頭部之間差距的縮小,將成為一種愈發(fā)顯著的趨勢(shì)。

      2025 年既可能華為、特斯拉的 " 巔峰時(shí)刻 ",也可能是理想、小鵬等 VLA 實(shí)踐者的 " 逆襲元年 "。

      在這場(chǎng)智能主權(quán)的爭(zhēng)奪中,只有那些率先突破核心壁壘、構(gòu)建差異化優(yōu)勢(shì)的企業(yè),才能最終殺出重圍。

      相關(guān)標(biāo)簽

      相關(guān)閱讀

      最新評(píng)論

      沒(méi)有更多評(píng)論了

      覺(jué)得文章不錯(cuò),微信掃描分享好友

      掃碼分享

      熱門(mén)推薦

      查看更多內(nèi)容