文 | 日晞野望,作者|咸閑
8 月 9 日,在世界機器人大會的演講臺上,宇樹科技創(chuàng)始人王興興談論到目前機器人運動控制領(lǐng)域存在的 RL Scaling Law 問題,他認為現(xiàn)在的機器人在學習一項新的技能時,往往都是需要從頭開始研究以及教學。
而在未來更加希望的是能夠在原有的基礎(chǔ)上去不斷學習,使得他們的學習速度更加快速以及效果更好。
整個具身智能行業(yè)在目前并沒有人將強化學習的 Scaling Law 做好,所研究的算力增長、數(shù)據(jù)堆積,并不能直接讓機械手臂變得更加靈巧,或者讓雙足的機器人走得更穩(wěn)。
事實上,問題并不在于我們所提供的硬件、數(shù)據(jù)不夠好,而是其 " 大腦進化 " 以及環(huán)境不斷適應,那么,面對具身智能 Scaling Law 缺失,我們是否應該如同嬰兒時的教學,讓其不斷嘗試,具備真正不斷演化的能力,促使機器人界的 " 摩爾定律 " 誕生?
算力增長≠智能進化:具身智能的物理瓶頸困局
在目前的人工智能領(lǐng)域,我們逐漸認為當我們提供了更多的數(shù)據(jù)以及算力時,就能夠支撐機器人擁有更聰明的能力。
例如,ChatGPT 的發(fā)展似乎印證了這一點——給它更大的模型、更多的訓練文本,它就能寫出更流暢的文章,解答更復雜的問題。
我們可以知道在虛擬 ai 領(lǐng)域,數(shù)據(jù)是單一的,規(guī)則是明確的,所以增加算力和數(shù)據(jù)就能夠去提升虛擬 ai 的性能。
但當這樣的方式放到機器人的身上,在它與現(xiàn)實世界交互的時候,我們發(fā)現(xiàn)其真實效果往往就會受到不同材質(zhì)的摩擦、空氣阻力、物體形變等產(chǎn)生隨機性影響,比如,運行中會被一些障礙物絆倒等。
哈佛大學的 " 機器螞蟻 " 實驗生動地展示了這個困境。研究人員給這個小機器人增加了 10 倍的運算能力,期待它能更好地適應復雜地形。
但結(jié)果令人失望:它的環(huán)境適應能力只提升了微不足道的 2%。問題不在于芯片不夠強,而在于螞蟻的機械腿無法像真實昆蟲那樣靈敏地感知和適應地面變化。
所以,現(xiàn)實世界中無數(shù)的物理特性就讓機器人在運行出現(xiàn)了無數(shù)個 " 意外狀況 "。
并且,如今機器人在學習新的技能以及適應新環(huán)境時,其芯片總是會需要較大的能耗。
這并不是通過技術(shù)的不斷進化,從而減少能耗的消耗量能夠解決的問題,而是應該去面對根本性的缺陷:機器人還在用 " 蠻力計算 " 來對抗物理法則。
這樣的困境揭示了一個深刻的事實:在機器人領(lǐng)域,單純的算力增長就像給汽車裝了強勁的引擎,卻忘了我們所要前行的道路是崎嶇、坑洼的道路,它是否能夠?qū)崟r應對路況呢?
我們更加希望的是其能夠像人類的生物系統(tǒng)一樣,總是在原有的基礎(chǔ)之上不斷進化,去面臨并解決受物理世界制約的困境。
達爾文式進化:具身智能的身體適應智慧
真正智能的關(guān)鍵并不是在于它的 " 大腦 " 學習的東西是不是足夠多,就比如在自然界中,章魚沒有脊椎動物那樣集中的大腦,它的 5 億神經(jīng)元分布在觸手中,卻能讓八條腕足各自獨立抓取、探測甚至 " 思考 "。
然而,這樣的生物所體現(xiàn)的行為是不同于機器人的集中依靠數(shù)據(jù)驅(qū)動的 " 大腦 " 智能模式,而是將身體本身也作為計算的一部分。
過去,機器人和 AI 的進步主要靠堆算力和數(shù)據(jù),就像不斷給計算機提供大量的知識,希望它變得更加聰明。
但事實上的現(xiàn)實智能發(fā)展,無論是人類嬰兒學步,還是動物的精準捕獵,都依賴著我們的身體與環(huán)境的實時互動。
所以我們更加需要它的身體有著的自己適應能力——就像人類肌肉會在出現(xiàn)突發(fā)狀況時,主動產(chǎn)生一定的行為。
然而機器人需要適應的是未在提前預設(shè)的情況下,根據(jù)指令以及環(huán)境變換,提供不同的狀態(tài)和行為。
正如,王興興所提及希望當機器人處于一個新的環(huán)境時,能夠主動去探索一些事物,來滿足我們所提供的指令,而不是我們將一些具體的數(shù)據(jù)提供給它,只需要照做就行。
未來的突破點可能在于其 " 身體 " 和 " 大腦 " 的像自然生物一樣共同進化,算法不再需要為每個細微的環(huán)境狀況進行不斷地訓練,而是像生物那樣在互動中自然調(diào)整。
這條路雖然艱難,但自然界的進化史當中已經(jīng)證明其可行性。從單細胞生物到人類,生命進化或許給我們提供了較優(yōu)方向。
未來的機器人或許需要向生物學習,發(fā)展出與物理世界和諧共處的 " 身體智能 "。
真正的突破,不是建造更精密的機械臂,而是創(chuàng)造出更加具有生命力的機器人。
重塑衡量標準:具身智能需要擁抱 " 生存力 "
對于具身智能來說,真正的考驗從來不是重復完成某個固定任務,而是在變化中保持穩(wěn)定。
目前的機器人缺乏真正的抗干擾智慧——不是避免犯錯,而是犯錯后快速修正的本事。
我們總是笑著現(xiàn)在的機器人有著些許笨拙的行為,甚至對于它們的動作稱之為 " 老太行為 ",但對于這樣還需不斷進化的具身智能來說,應該把 " 容錯率 " 變成衡量智能的新尺度。畢竟在真實世界里,穩(wěn)定比精準更重要。
像在孩童時期,當我們拿起保溫杯時,不需要重新學習 " 抓握 " 這個動作——我們知道它和馬克杯一樣都是圓柱形容器,只需微調(diào)力度,就能夠同樣的拿起這個東西。
但今天的機器人完美掌握馬克杯后,面對保溫杯時又要從零開始訓練。問題不在于它不夠 " 聰明 ",而在于它缺乏對 " 杯子 " 這個概念的真正理解。
這種" 泛化能力 " 的缺失,暴露了當前機器人學習的核心缺陷:它們通過海量數(shù)據(jù)只能記住對于這個特定物體的抓取方式,卻無法抽象出通用規(guī)律。
真正的突破可能需要讓機器人像孩子一樣,先理解 " 抓握 " 的本質(zhì)(形狀、重量、摩擦力之間的關(guān)系),而不是死記硬背每個物體的數(shù)據(jù)。
當測評標準轉(zhuǎn)向 " 生命力 " 而非 " 精準度 ",具身智能才能突破現(xiàn)在的天花板,邁向真正的實用化。
參考資料:
1. 杭州 ai 之都— —王興興 " 炸裂 " 發(fā)言:機器人的 ChatGPT 時刻 即將到來丨王興興在 2025 世界機器人大會演講實錄(文字 + 視頻)
2. 機器之心— — 機器人邁向 ChatGPT 時刻!清華團隊首次發(fā)現(xiàn)具身智能 Scaling Laws