7 月 27 日,2025 世界人工智能大會騰訊論壇期間,騰訊 Robotics X 實(shí)驗(yàn)室與福田實(shí)驗(yàn)室聯(lián)合發(fā)布具身智能平臺 Tairos(鈦螺絲)。雷峰網(wǎng) AI 科技評論獲悉,其由模型算法和云服務(wù)兩部分組成,模型層包含多模態(tài)感知模型、規(guī)劃大模型以及感知行動聯(lián)合大模型,云服務(wù)平臺則包含仿真平臺、數(shù)據(jù)平臺以及開發(fā)工具等。
感知、規(guī)劃、行動分別對照著人類的右腦、左腦和小腦。
現(xiàn)場,搭載了 Tairos 的宇樹機(jī)器人 " 小騰 " 可以聽懂并遵照 " 到我身邊來 " 的指令,看得見也說得清桌面上的物體,能弄明白物體增添變化,記得起自己昨天在做什么。這意味著,機(jī)器人開始具備長記憶能力。
除了宇樹,騰訊公布的首批合作伙伴名單還包括越疆科技、樂聚機(jī)器人、帕西尼感知科技、擎朗智能、眾擎機(jī)器人科技等機(jī)器人本體公司。作為國內(nèi)首個(gè)以模塊化的方式提供大模型、開發(fā)工具和數(shù)據(jù)服務(wù)的具身智能軟件平臺,Tairos 通過即插即用的方式面向機(jī)器人行業(yè)開放。
合作模式折射了騰訊戰(zhàn)略的調(diào)整。自去年以來,馬化騰先后在多場合明確," 騰訊的目標(biāo)是與各大機(jī)器人廠商攜手合作,而非親自下場制造硬件 "。
據(jù)悉,Tairos 背后的騰訊 Robotics X 實(shí)驗(yàn)室成立于 2018 年,此前曾推出四足機(jī)器人 Max、輪腿機(jī)器人 Ollie、人居環(huán)境機(jī)器人 " 小五 " 以及三指 / 五指靈巧手 TRX-Hand、機(jī)械臂 TRX-Arm,覆蓋了操作、運(yùn)動、感知、智能、硬件設(shè)計(jì)等機(jī)器人核心技術(shù)棧。本次 Tairos 具身智能平臺或意味著其藍(lán)圖進(jìn)一步清晰化。騰訊首席科學(xué)家、Robotics X 實(shí)驗(yàn)室主任、福田實(shí)驗(yàn)室主任張正友指出,Tairos 致力于為機(jī)器人本體與應(yīng)用開發(fā)商補(bǔ)齊關(guān)鍵軟件能力。
大廠 "all in AI" 時(shí)代,興趣點(diǎn)日漸從模型層面向具身智能領(lǐng)域延伸。
同日發(fā)布的騰訊混元 3D 世界模型也有所暗示。早在去年底,混元 3D 生成大模型即已推出,到今年 4 月已迭代到 2.5 版本。此番 " 世界 " 二字融入產(chǎn)品名稱,也提供了一種新的想象空間:騰訊混元或許在延伸出一條通往具身智能的 " 隱路 "。
3D 生成大模型總體有兩條路。一條通往虛擬世界生成,主要應(yīng)用于游戲、動漫、元宇宙等的藝術(shù)創(chuàng)作;一條通往現(xiàn)實(shí)世界仿真,供自動駕駛、具身智能訓(xùn)練。
目前,混元恰好站在從第一條路延伸向第二條路的銜接階段。
騰訊混元 3D 負(fù)責(zé)人郭春超表示,混元 3D 的路線圖是從 " 重建一個(gè)物體 ",到 " 生成一個(gè)場景 ",再到 " 理解一個(gè)世界 "。目前,騰訊還處在場景這一步,穩(wěn)定的三維場景是一切的基礎(chǔ),也能夠作為后續(xù)動作的載體。
據(jù)透露,其首要的目標(biāo)是把三維資產(chǎn)生成做到更好的商用的水平。" 但確定的一點(diǎn)是,模型整體會朝著一個(gè)更完整、更能真實(shí)模擬物理規(guī)律的世界模型發(fā)展,我們今年會先重點(diǎn)起步,明年會逐步提升成熟度。" 他告訴雷峰網(wǎng) AI 科技評論。
事實(shí)上,3D 生成的路線一直存在爭議,主流呈現(xiàn)兩大分支,一是基于純 3D 的方式做空間構(gòu)建,另一則基于純 2D 也即視頻模型構(gòu)建。前者囿于 3D 場景數(shù)據(jù)匱乏,生成多樣性不足;后者則因?yàn)槿狈θS空間約束,空間穩(wěn)定性差。
在空間穩(wěn)定性和多樣性之間尋找中間路線,騰訊采用了 3D+2D 的方式。郭春超介紹,前景物體用 3D 方式構(gòu)建,中景通過 2.5D 實(shí)現(xiàn)多視角補(bǔ)齊,遠(yuǎn)景則采取 2D 方式,因此整個(gè)模型采用的是一種分層的結(jié)合路線。
" 世界模型面臨的主要問題——無論是對游戲制作還是具身訓(xùn)練——多樣性不足。" 他進(jìn)一步解釋,因?yàn)?3D 動作序列資產(chǎn)稀缺,依賴純粹 3D 會面臨交互不自然,預(yù)測不準(zhǔn)確,未來將加大在交互上的投入,加入更多 2D 生成的模型范式。