中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      鈦媒體 9分鐘前

      AI 浪潮下,具身智能的崛起與數(shù)據(jù)瓶頸

      文 | 捉羊李

      具身智能在 AI 賽道領(lǐng)域愈發(fā)火熱,幾乎國內(nèi)外所有科技大廠,都或多或少投身于這個浪潮中,數(shù)億級融資不斷。

      就在這兩日,世界機(jī)器人大會(WRC 2025)正在北京如火如荼的舉辦,其熱度不亞于幾日前的 WAIC。備受矚目的國內(nèi)具身智能獨(dú)角獸們紛紛展示絕活,宇樹科技的兩名 Unitree G1 機(jī)器人上演了一場拳擊賽;銀河通用機(jī)器人輪盤人形機(jī)器人 Galbot 化身小賣部店員,為顧客取送商品;星動紀(jì)元則展示了最新發(fā)布機(jī)器人 L7 智能分揀包裹的能力。還有加速進(jìn)化的 T1 機(jī)器人踢足球賽、擎朗智能的雙足服務(wù)機(jī)器人 XMAN-F1 打爆米花等等,會場共有 200 余家機(jī)器人企業(yè)大秀肌肉,展現(xiàn)產(chǎn)品的落地場景和應(yīng)用能力。

      具身智能的時代將至,我們該如何理解具身智能?它又面臨著何種的瓶頸與未來?

      我們?nèi)绾卫斫饩呱碇悄埽?/b>

      我們?nèi)祟愒诔錾筮€沒有理解社會語言時,無法對語言的指令做出反饋,但可以通過視覺、觸覺、聽覺等感知向外界做出回饋,并慢慢通過 " 感知 - 行動 " 逐步來學(xué)習(xí)認(rèn)知。這也就是具身智能所在做的事情,具身智能通過將人工智能融入到機(jī)器人等實(shí)體產(chǎn)品中,賦予他們?nèi)缤祟愐粯痈兄饨绾蛯W(xué)習(xí)交互的能力,并以此作出決策,進(jìn)而在不同的場景 " 隨機(jī)應(yīng)變 " 地完成任務(wù)。

      在中外諸多文獻(xiàn)中,非具身智能(Disembodied AI)又稱互聯(lián)網(wǎng)智能(Internet AI)。非具身智能并不需要與外界進(jìn)行物理交互,也并不需要遷移進(jìn)真實(shí)世界中的實(shí)體。非具身智能往往依賴喂哺給它的數(shù)據(jù),它更像一個 " 思想家 " 而非 " 實(shí)踐家 ",當(dāng)然它也具有它的優(yōu)勢,如 AlphaGo,橫掃數(shù)十位圍棋大師。

      上海交通大學(xué)教授盧策吾曾給出一個案例去解釋這兩者之間中的區(qū)別,他將非人類視角的智能稱為第三人稱智能,也就是非具身智能,通過輸入盒子樣式的符號,讓機(jī)器學(xué)習(xí)什么是盒子;而人類視角的智能,則是通過打開盒子,去體驗(yàn)什么是盒子。這便是實(shí)踐性學(xué)習(xí)方法和概念性學(xué)習(xí)方法的區(qū)別。

      (圖片來源于網(wǎng)絡(luò))

      從技術(shù)層面來說,我們也在從大語言模型(LLM)到圖像 - 語言模型(VLM)再到圖像 - 語言 - 動作多模態(tài)模型(VLA)不斷推進(jìn),讓機(jī)器人能處理更多信息,不局限于只是單純的實(shí)現(xiàn)輸入的指令,而是實(shí)現(xiàn)更復(fù)雜的交互,推動人形機(jī)器人實(shí)現(xiàn)具身智能。

      具身智能數(shù)據(jù)采集的瓶頸

      盡管具身智能行業(yè)前景光明,但目前行業(yè)發(fā)展面臨一個繞不開的難題:數(shù)據(jù)的稀缺性。其稀缺性原因有二,一是因?yàn)閿?shù)據(jù)采集成本高,二是因?yàn)閿?shù)據(jù)量難以形成規(guī)模。

      為什么說具身智能的多模態(tài)數(shù)據(jù)獲取成本更高?人工智能的演進(jìn)與發(fā)展都依靠數(shù)據(jù)對模型以及機(jī)器人的的訓(xùn)練。上文提到的非具身智能中收集并用來訓(xùn)練的數(shù)據(jù)大多來源于公開的互聯(lián)網(wǎng)文本,可以通過互聯(lián)網(wǎng)用戶的瀏覽、搜索、點(diǎn)擊、發(fā)言等線上行為來獲取數(shù)據(jù)。而具身智能領(lǐng)域獲取數(shù)據(jù)就更加復(fù)雜,它涉及到機(jī)器人與真實(shí)世界的動態(tài)交互,比如抓取、搬運(yùn)、行走、避障等,需要采集機(jī)器人在與環(huán)境交互時視覺、觸覺、力覺等多模態(tài)的傳感數(shù)據(jù)以及決策數(shù)據(jù),這就決定了這類數(shù)據(jù)耗時長且生成成本更加高昂。

      并且具身智能對數(shù)據(jù)的需求還具有海量、高質(zhì)量且多樣化的特點(diǎn)。例如,自主導(dǎo)航機(jī)器人需要處理海量環(huán)境數(shù)據(jù),以增強(qiáng)其路徑規(guī)劃和避障能力;執(zhí)行高精度任務(wù)的工業(yè)機(jī)器人需要極其精確的數(shù)據(jù),微小的誤差都可能導(dǎo)致嚴(yán)重的生產(chǎn)質(zhì)量問題;家庭服務(wù)機(jī)器人必須擁有廣泛的家庭環(huán)境數(shù)據(jù),來提高泛化能力,以適應(yīng)不同家庭的各項(xiàng)任務(wù)。

      具身智能的數(shù)據(jù)量難以形成規(guī)模,是因行業(yè)中存在 " 數(shù)據(jù)孤島 "。

      因?yàn)榇蠖鄶?shù)具身智能機(jī)器人都需要在特定環(huán)境中收集數(shù)據(jù),他們的數(shù)據(jù)存儲格式、元數(shù)據(jù)形式、數(shù)據(jù)標(biāo)注粒度都并不相同。并且由于高昂的成本以及隱私安全考慮,公司與公司之間并不會共通數(shù)據(jù)。現(xiàn)下的數(shù)據(jù)集無法共通,數(shù)據(jù)無法最大化的利用,導(dǎo)致行業(yè)間會有重復(fù)工作和資源浪費(fèi),形成一座座不互通的 " 數(shù)據(jù)孤島 "。數(shù)據(jù)無法流轉(zhuǎn),無法形成一個標(biāo)準(zhǔn)體系,大大減緩了具身智能的進(jìn)展。

      合成數(shù)據(jù)或者是出口

      上文中提到,具身智能對真實(shí)數(shù)據(jù)的采集、處理、標(biāo)注和利用都面臨諸多挑戰(zhàn)。且人工智能領(lǐng)域的訓(xùn)練數(shù)據(jù)還存在一個通用的問題,即人類生成數(shù)據(jù)的速度無法匹及到 AI 不斷增漲的需求。

      馬斯克在今年年初曾表示," 在 AI 訓(xùn)練中,我們現(xiàn)在基本已經(jīng)耗盡了人類積累的總和。"OpenAI 聯(lián)合創(chuàng)始人兼前首席科學(xué)家伊利亞 · 蘇茨克維爾在神經(jīng)信息處理系統(tǒng)(NeurIPS)大會也曾直言道," 人工智能的訓(xùn)練數(shù)據(jù)如同化石燃料一樣面臨著耗盡的危機(jī) "。互聯(lián)網(wǎng)智能的數(shù)據(jù)尚且不足以訓(xùn)練消耗,何況是更難以獲取的多模態(tài)數(shù)據(jù)呢?

      綜合原因下,目前具身智能領(lǐng)域大多使用的是以合成數(shù)據(jù)為主、真實(shí)數(shù)據(jù)為輔的模式。

      真實(shí)數(shù)據(jù)(Real World Data)屬于人類創(chuàng)建的文本、圖像和視頻,是在真實(shí)事件和場景下生成中的數(shù)據(jù)。合成數(shù)據(jù)(Synthetic Data)就是通過仿真系統(tǒng)或生成式 AI 技術(shù),在虛擬環(huán)境中 " 模擬 " 出機(jī)器人與環(huán)境的交互場景。這一仿真技術(shù)叫做 Sim-to-Real,利用技術(shù)手段,將虛擬環(huán)境無限地逼近于真實(shí)場景,相當(dāng)于給受訓(xùn)的機(jī)器人們創(chuàng)造一個 " 元宇宙 "。

      以此生成的數(shù)據(jù)雖然不是直接從現(xiàn)實(shí)世界中采集的,但經(jīng)過精心設(shè)計(jì)和技術(shù)處理,也可以具備較強(qiáng)的真實(shí)性和泛化能力。合成數(shù)據(jù)由于無需人工遙操機(jī)器、無需標(biāo)注等特點(diǎn)成本相對更加低廉,使用率也更高于其他行業(yè)。據(jù)合成數(shù)據(jù)公司光輪智能的甘宇飛表述,在自動駕駛領(lǐng)域,合成數(shù)據(jù)的使用比例大約在 30% 至 40% 之間,而在具身智能領(lǐng)域,這一比例則高達(dá) 80% 至 90%。

      (圖片來源于網(wǎng)絡(luò))

      合成數(shù)據(jù)是一把達(dá)摩利斯之劍。它成本低廉,還能讓機(jī)器人在萬端變換的環(huán)境中安全的測試;但合成數(shù)據(jù)畢竟依賴于模擬環(huán)境,可能會編造出看似合理但并不可能存在的場景,甚至一絲光照的差別都可能導(dǎo)致 AI 出現(xiàn)行為偏差,甚至走向 " 崩潰 "。

      綜合原因下,目前具身智能領(lǐng)域大多使用的是以合成數(shù)據(jù)為主、真實(shí)數(shù)據(jù)為輔的模式。并需要將兩者數(shù)據(jù)的時間空間維度對齊,將虛擬與真實(shí)更好的彌合才能高效的訓(xùn)練具身智能,這也是行業(yè)間大多使用的戰(zhàn)略性決策。

      具身智能機(jī)器人的落地和商業(yè)化

      具身智能的載體不一定是人形機(jī)器人,但是人形機(jī)器人是更好的載體,也是追逐的風(fēng)口。目前,誰家能將具身智能機(jī)器人商業(yè)化量產(chǎn)落地?這是各行各業(yè)都在關(guān)注的話題。

      我想,這一天的到來可能沒有那么快,行業(yè)仍處于訓(xùn)練階段,量產(chǎn)落地可能還需要幾年時間。具身智能的概念很大,展望的前景很廣,但其訓(xùn)練成本和生產(chǎn)生產(chǎn)成本過高,未來生產(chǎn)力必然是決定行業(yè)黑馬的重要因素。

      我們期待具身智能機(jī)器人飛入尋常百姓家這一天的到來。

      參考文獻(xiàn):

      1. 為什么說具身智能是通往 AGI 值得探索的方向?上海交大教授盧策吾深度解讀

      2.《獨(dú)家對話光輪智能:合成數(shù)據(jù)如何破解 AI" 數(shù)據(jù)饑渴 "》|50x50 https://www.tmtpost.com/7582234.html

      3.《The Value of Data in Embodied Artificial Intelligence》| https://cacm.acm.org/blogcacm/the-value-of-data-in-embodied-artificial-intelligence/#six

      相關(guān)閱讀

      最新評論

      沒有更多評論了