作者| Li Yuan
編輯| 鄭玄
筆者剛剛從今年的世界機(jī)器人大會回來。
「人,實(shí)在是太多了?!惯@是今年世界機(jī)器人大會上,幾乎每個(gè)人見面的第一句開場白。
世界機(jī)器人大會人潮年年洶涌,但今年,那種摩肩接踵的壓迫感格外強(qiáng)烈。
不過,比人多更震撼的,是你幾乎無處不遇的機(jī)器人。去年,它們繞場走一圈,還得三五個(gè)「保鏢」在旁牽繩護(hù)送;今年,尤其是開展第一天,你一個(gè)轉(zhuǎn)身,就可能與一臺兩條腿、甚至四條腿的新物種擦肩而過。
今年的機(jī)器人,變得前所未有地渴望與世界互動——疊衣服、拉被子、和觀眾比試拳擊、踢球、和觀眾互動遞送物體……同時(shí),這種急切也帶來了大量的翻車現(xiàn)場——你幾乎能在社交媒體上找到所有頂尖公司的翻車現(xiàn)場,無論是鬼畜的機(jī)器人倒地抽搐,還是自信滿滿地抓取眼前的東西,結(jié)果一直在努力地抓著空氣。
但是比起前幾年機(jī)器人展會上,很精心編排的機(jī)器人舞蹈,固定交互中慢速的把一個(gè)東西抓到另一個(gè)地方,你能明顯感覺到有活力從里面生長了出來。
相比于其他行業(yè),機(jī)器人企業(yè)似乎更不避諱翻車現(xiàn)場。這種不精心編排的演示,帶著一種經(jīng)濟(jì)上行的美感:一種「我知道我會出錯(cuò),但我依然是未來」的自信。它混亂,卻迷人,屬于高速增長行業(yè)獨(dú)有的美感。
這也是這次筆者從世界機(jī)器人大會回來最深的感觸:只要有未來,只要長得足夠快,人們愿意等待一個(gè)暫時(shí)無用的機(jī)器人。
01
加速的進(jìn)化:
為何行業(yè)如此振奮?
人們之所以如此寬容,是因?yàn)闄C(jī)器人這個(gè)行業(yè),尤其是人形機(jī)器人這個(gè)賽道,仍然在以一個(gè)極高的速度,同時(shí)進(jìn)化著它的「兩翼」。
兩翼的一端,是雙足人形機(jī)器人的運(yùn)動能力。
這是筆者來過的第三年世界機(jī)器人大會,在 2023 年的世界機(jī)器人大會上,宇樹機(jī)器人的 CEO 王興興還在和在場的機(jī)器人同行們解釋,為什么前一年開始入局做人形機(jī)器人的算法, 在接受極客公園采訪的時(shí)候,提到當(dāng)時(shí)「波士頓動力的軟件層面遙遙領(lǐng)先」 。當(dāng)時(shí)整場的人形機(jī)器人,能直接行走的屈指可數(shù)。
而短短兩年,人形機(jī)器人的運(yùn)動能力已經(jīng)大大升級。
宇樹機(jī)器人一如既往地展現(xiàn)出了第一流的運(yùn)動控制能力。現(xiàn)場觀看搏擊比賽,機(jī)器人的力度真的有點(diǎn)令人震撼。
而這種運(yùn)動能力并沒有限于宇樹,是多點(diǎn)開花的。
眾擎機(jī)器人長項(xiàng)在于擬人動作,跳舞的動作像人的可怕。
往年,一個(gè)機(jī)器人能聽懂語音指令,然后慢慢抓起一個(gè)特定的小球遞給你,就已經(jīng)是頂級演示。今年,多家公司的展示,已經(jīng)將目標(biāo)指向了柔性物體的操作——這是從「會抓」到「會用」的關(guān)鍵一步。
柔性物體的難度在于它的不可預(yù)測性。一個(gè)剛性的瓶子,物理屬性恒定;而一件衣服、一個(gè)香囊,是無定形的、柔軟的,每一次抓取都可能呈現(xiàn)不同形態(tài)。要拿穩(wěn)它,不僅需要「看見」,更要「理解」,還得在毫秒之間預(yù)判它的形變,并即時(shí)調(diào)整力度。剛性物體的抓取,在日常生活中只占一小部分;而柔性物體,才是通向家庭和服務(wù)場景的必經(jīng)之路。
今年,已經(jīng)有多家公司在這一領(lǐng)域展現(xiàn)出令人驚訝的成果:
比如星海圖此次展示的拉被子演示。視頻雖然有加速,但是能夠把被角收起的情況下機(jī)器人自主推理找到被角拉開,且多次隨機(jī)重復(fù)下都能成功,也是很精彩的演示。
以年為單位來看機(jī)器人的進(jìn)步,無疑是巨大的。
更重要的是,這些能力并非由某一家壟斷。在這個(gè)高速發(fā)展的賽道中,新玩家持續(xù)涌入,帶來更多可能性。比如,長期以服務(wù)機(jī)器人聞名的擎朗智能,今年也推出了自己的雙足機(jī)器人,計(jì)劃在酒店等熟悉場景中進(jìn)行商業(yè)落地。擎朗 CEO 李通在極客公園采訪中表示,雙足研發(fā)的技術(shù)壁壘已不再高企,「看到機(jī)會就可以做」。
在高速發(fā)展的賽道中,大批成立于 2024 年,甚至成立于 2025 年的等實(shí)力選手紛紛入局,各自帶著獨(dú)門絕技,在這片叢林中占據(jù)自己的山頭。
當(dāng)然,促使這場進(jìn)化的,還有嗅到商機(jī)的源源不斷的投資人。他們用真金白銀投票,確保這場關(guān)于進(jìn)化的豪賭,有足夠的燃料,以當(dāng)前這令人眩目的速度,繼續(xù)狂奔下去。
02
略顯尷尬的落地:
雙足提供情緒價(jià)值,操作只能找小場景
「這機(jī)器人能落地嗎?」
這是展會現(xiàn)場空中飄蕩著的最響亮的問題,從投資人到創(chuàng)業(yè)者,再到每一個(gè)好奇的觀眾都對這個(gè)話題很是關(guān)心。
但當(dāng)筆者逛遍世界機(jī)器人大會,一個(gè)略顯尷尬的落地現(xiàn)狀是:在當(dāng)下,人形機(jī)器人在很大程度上仍是「無用」的。
一位資深投資人向我估計(jì),今年全行業(yè)的人形 / 類人型機(jī)器人總出貨量也許在三萬臺左右。
而筆者走訪各家展臺得到的體感甚至更為保守:大多數(shù)公司的年出貨量目標(biāo)都只在幾百臺,能突破一千臺的,已是金字塔尖的佼佼者。
宇樹 CEO 王興興一直表示,研究機(jī)器人,最終是希望它來干活的。不過當(dāng)被問及當(dāng)下雙足機(jī)器人的價(jià)值,除了情緒價(jià)值之外,還有什么?
宇樹創(chuàng)始人王興興的答案坦誠得驚人。他表示,之所以做雙足,是因?yàn)樗夹g(shù)上更簡單,是一種「Why not?」(為何不呢?)的邏輯。哪些技術(shù)先成熟,哪些技術(shù)就優(yōu)先做。
情緒價(jià)值沒有對標(biāo),在雙足機(jī)器人領(lǐng)域,市場競爭目前似乎也在變得更加激烈,讓 " 無用之用 " 的接受度更高。
如果說兩條腿的機(jī)器人,目前主要在提供情緒價(jià)值;那么,長著兩只手的操作型機(jī)器人,則面臨著另一種更棘手的困境——「有用之難」。
工廠、智慧零售、酒店餐飲……這些宏大的敘事誰都懂,但現(xiàn)實(shí)是,技術(shù)還遠(yuǎn)遠(yuǎn)達(dá)不到。
一方面,機(jī)器人的「大腦」還不夠聰明。目前的模型訓(xùn)練,大多只能完成幾個(gè)孤立的動作,要讓一個(gè)機(jī)器人在一個(gè)真實(shí)場景里,成功完成多項(xiàng)任務(wù),暫時(shí)還不太容易做到。
另一方面,靈巧操作仍是巨大的瓶頸,需要依靠數(shù)據(jù)、硬件等多方面技術(shù)一起進(jìn)步。
目前行業(yè)比較認(rèn)同的 VLA 路線,嚴(yán)重依賴于數(shù)據(jù)。而實(shí)際上,數(shù)據(jù)的高質(zhì)量的操作數(shù)據(jù)又極度依賴高精度硬件來采集。而硬件的迭代,本身也需要一定的時(shí)間和操作來反哺迭代。
今年,一些公司已經(jīng)意識到這一核心痛點(diǎn),開始試圖解決這一問題。
比如,2025 年才成立的零次方,據(jù)稱今年已出貨 200 臺,能在 2025 年成立后迅速就出貨的原因之一,就是其核心技術(shù)能力之一就是做高質(zhì)量數(shù)據(jù)采集。
筆者也在展臺體驗(yàn)了星塵智能的數(shù)據(jù)采集工具。展臺人員介紹,他們采用繩驅(qū)傳動、極度絲滑的硬件結(jié)構(gòu),才能采集出更「干凈」的數(shù)據(jù),進(jìn)而訓(xùn)練出動作同樣絲滑的模型。
也仍然有許多公司,選擇在真實(shí)環(huán)境中硬碰硬,實(shí)地采集數(shù)據(jù),力圖找到那個(gè)能真正撐起商業(yè)化的切入口。
這個(gè)場景或許需要有點(diǎn)苛刻——需要一定的泛化操作能力,以至于此前工業(yè)機(jī)械臂無法覆蓋;同時(shí)又要避開與人頻繁接觸、過高速度要求,以及廉價(jià)人工過于容易替代的可能。
條件雖然苛刻,但這樣的場景并非不存在,例如工廠某些特殊的上下料環(huán)節(jié),比如服務(wù)業(yè)的某一個(gè)整理行為。各家各擅其場,都在找自己的細(xì)分領(lǐng)域,也都在相信自己可以從一臺兩臺試驗(yàn)機(jī),慢慢漲到十臺幾十臺試點(diǎn)機(jī),慢慢開始逐漸滲透一個(gè)場景。
所以說,無論是「無用之用」,還是「有用之難」,為什么行業(yè)對這種落地的尷尬似乎并不在意?
答案簡單而純粹——因?yàn)殡m然距離真正的「有用」還很遙遠(yuǎn),但每一家的出貨量,都在實(shí)實(shí)在在地增長。
只要曲線還在上揚(yáng),技術(shù)還在進(jìn)步,就有希望。
03
為何等待?
一場可以「寸進(jìn)」的長跑
在今年的世界機(jī)器人大會上,筆者觀察到一個(gè)迷人的悖論。
幾乎每一位機(jī)器人公司的 CEO,在描繪未來兩三年的宏偉藍(lán)圖時(shí)都充滿了不容置疑的樂觀,但話鋒一轉(zhuǎn),又都會真誠地補(bǔ)上一句:「請給我們一些包容,成長不會那么快?!?/p>
這種略微矛盾的姿態(tài),也精準(zhǔn)地投射到了公眾的認(rèn)知里。
在網(wǎng)絡(luò)輿論場,人們對人形機(jī)器人的觀感幾乎是撕裂的:要么是頂禮膜拜,視其為下一個(gè)時(shí)代的序章;要么是嗤之以鼻,斷言它不過是昂貴的遙控玩具。
行業(yè)內(nèi)部也遠(yuǎn)未達(dá)成共識。有人堅(jiān)信,VLA(視覺 - 語言 - 行為模型)就是技術(shù)的「奇點(diǎn)」,通往通用智能的康莊大道已然鋪開,剩下的只是時(shí)間和算力的問題;也有人認(rèn)為,技術(shù)仍在混沌中爆炸性發(fā)展,行業(yè)還在等待一個(gè)能定義范式的、天才式的突破。
那么,在這種遍布著矛盾、分歧與誤解的喧囂中,行業(yè)那股不可動搖的信心,究竟從何而來?
答案或許只有一個(gè),那就是相比其他前沿科技,機(jī)器人產(chǎn)業(yè)有著一項(xiàng)無可比擬的特權(quán):「寸進(jìn),亦是勝利。」
自動駕駛的宿命,是「L5 或一無所有」,在抵達(dá)那個(gè)完美終點(diǎn)前,每一步商業(yè)化都如履薄冰。而機(jī)器人不同,模型能力每向前推進(jìn)一毫米,就可能撬開一個(gè)細(xì)分到極致的新場景——哪怕這個(gè)場景,僅僅是支撐一家企業(yè)多賣出幾百臺機(jī)器人,獲得活下去的燃料,奔赴下一場更艱難的戰(zhàn)役。
或許資本,也是看清了這場增量游戲的本質(zhì),才愿意不斷加注。他們愿意忍受更長的周期,去賭一個(gè)可以被「分期兌現(xiàn)」的未來。
但耐心是有額度的,他們究竟能賭多久?
在一場英偉達(dá)舉辦的論壇中,宇樹王興興和銀河通用王鶴同場對談,對行業(yè)未來做出預(yù)測。
宇樹的王興興給出的答案是每年至少翻一倍;而王鶴的預(yù)測,則是每年翻十倍。
從一倍到十倍,這道巨大的裂谷,就是對行業(yè)未來不確定性最誠實(shí)的度量。
它意味著,沒有人真正知道終點(diǎn)線有多遠(yuǎn),也沒有人知道通往終點(diǎn)的正確路徑。
他們唯一確信的,只有一件事:
在一個(gè)高速成長的行業(yè)中,速度是唯一的通行證。
* 頭圖來源:視覺中國
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO