中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      量子位 15小時前

      全球首個具身智能開放平臺來了!讓大模型長出“身體”,像人一樣自然表達(dá)交互

      具身智能賽道的想象力,遠(yuǎn)比眼前的機器人要遼闊。

      當(dāng)大家還在琢磨怎么把大模型塞進(jìn)機器人里時,數(shù)字人也和具身智能關(guān)聯(lián)上了。

      就在今天,魔琺科技發(fā)布了面向開發(fā)者的具身智能基礎(chǔ)設(shè)施——「魔琺星云」具身智能 3D 數(shù)字人開放平臺。

      這也是全球首個。

      在魔琺星云的驅(qū)動下,不僅大語言模型能夠 " 長出身體 ",實體機器人也能像人一樣擁有動作、表情,實現(xiàn)自然表達(dá)。

      憑借低于1.5 秒的端到端延遲、千萬級并發(fā)能力,以及百元級算力即可運行的架構(gòu),人機對話幾乎就像朋友面對面聊天一樣自然。

      這是怎么做到的?

      魔琺星云:讓 AI 擁有身體的開發(fā)者平臺

      魔琺星云魔琺科技推出的面向開發(fā)者的具身智能 3D 數(shù)字人開放平臺。

      它可以根據(jù)文本,實時生成 3D 數(shù)字人的語音、表情、眼神、手勢和身體動作,讓任何屏幕、應(yīng)用、終端都實現(xiàn)自然、流暢的多模態(tài)交互。

      魔琺星云主要驅(qū)動 3D 具身數(shù)字人的三大應(yīng)用方向。

      首先,魔琺星云可以為大模型和 AI 智能體提供身體和表達(dá)能力,讓原本只能文字交流的模型,通過語音、表情和動作與人類進(jìn)行自然互動。

      其次,它可以讓手機、平板、電視、車載屏幕等各種終端升級為具身智能界面,讓每一塊屏幕都能 " 能說、會動 ",從被動的信息載體轉(zhuǎn)變?yōu)橹鲃拥姆?wù)者或信息提供者。

      最后,魔琺星云還能驅(qū)動人形機器人實現(xiàn)自然溝通。

      它可以在虛擬端生成關(guān)節(jié)級運動(運動學(xué)軌跡),通過仿真 + 模仿 / 強化學(xué)習(xí)映射到機器人(動力學(xué)控制)。

      這樣,機器人不僅能行走、操作,還能通過語音、眼神、手勢等自然方式與人交流,實現(xiàn)講解、導(dǎo)覽、交互問答等功能。

      由此,魔琺星云超越了普通的內(nèi)容生成工具,成為了讓大模型 " 有身體 " 的底層基建。

      在具體的應(yīng)用場景中,它能在酒店、政務(wù)大廳、展館等場景上崗,勝任接待、導(dǎo)辦、講解工作。

      無論是作為大屏互動窗口,還是化身為接待機器人,數(shù)字人都能做到 7 × 24 小時在線待命,提供始終如一的親切服務(wù)。

      在一些更細(xì)分的場景中——比如 AI 面試、線上培訓(xùn)等——數(shù)字人也突破了傳統(tǒng)的文本對話形式,讓用戶能夠與一個 " 有溫度 " 的具身形象進(jìn)行自然互動。

      對于個體開發(fā)者,魔琺星云也支持 SDK 或 API 部署調(diào)用,開發(fā)者可根據(jù)實際需要將魔琺星云能力嵌入任何終端——屏幕、機器人、App ……

      例如,開發(fā)者可以打造有形象、有表情、能對話的 AI 伙伴,或者通過 SDK/API 接入網(wǎng)頁、小程序或 App,生成有形象的具身數(shù)字人助手。

      可以說,魔琺星云平臺的發(fā)布志在將計算機圖形界面轉(zhuǎn)化成有形象、能交流、能辦事、能陪伴的具身智能體,讓屏幕活起來!

      而魔琺星云的落地實現(xiàn),離不開魔琺的核心優(yōu)勢。

      突破 " 高質(zhì)量、低延遲、高并發(fā) / 低成本 " 的不可能三角

      當(dāng)前,數(shù)字人的規(guī)?;虡I(yè)落地面臨多重挑戰(zhàn)。

      首先是體驗是否過關(guān)——數(shù)字人的形象、表情、動作、唇形與聲音是否自然,能否傳遞 " 人在場 " 的感受。

      其次是響應(yīng)速度——用戶輸入后系統(tǒng)能否快速反饋。在此基礎(chǔ)上,還需要兼顧成本可控規(guī)?;渴?/strong>與多終端適配能力。

      針對這些挑戰(zhàn),現(xiàn)有技術(shù)方案各有側(cè)重,形成了典型的不可能三角

      兼顧高畫質(zhì)與低延遲,需要大量算力投入,成本難以控制且難以規(guī)?;患骖櫢卟l(fā)與低成本,則難以保證畫質(zhì);兼顧高質(zhì)量與高并發(fā),又無法實現(xiàn)實時交互。

      而魔琺星云的推出,正是對這一不可能三角的首次突破。

      魔琺科技以自研的文生多模態(tài) 3D 大模型為核心,將語義、語音、表情、動作納入統(tǒng)一生成體系,多模態(tài)統(tǒng)一驅(qū)動,實現(xiàn)語音、表情與動作的自然同步與情感協(xié)調(diào)。

      更關(guān)鍵的是,圍繞模型,魔琺星云還設(shè)計了創(chuàng)新的云 - 端拆分架構(gòu)——

      云端僅生成語音和動作參數(shù),端側(cè) AI 直接渲染畫面,無需傳統(tǒng)引擎與 GPU 支持,就能使帶寬更小、延遲更低、算力更省。

      也正因這一架構(gòu),魔琺星云不僅可以在 RK3566、3588 等百元級芯片上流暢運行,還適配國產(chǎn)信創(chuàng)芯片,讓數(shù)字人真正跑在各種系統(tǒng)、終端,甚至中低端設(shè)備上,讓具身智能從實驗室走向隨處可用。

      此外,魔琺星云還有一個很強的底子:

      團(tuán)隊從 2018 年開始為游戲、影視、動畫公司制作 3D 內(nèi)容,到后來自己積累動畫數(shù)據(jù),目前已有數(shù)千小時的高質(zhì)量 3D 動畫資產(chǎn)。

      在一個 " 高質(zhì)量每秒成本上千元 " 的領(lǐng)域,這樣的數(shù)據(jù)體量不僅稀缺,更是支撐大模型表現(xiàn)力的關(guān)鍵。

      過去兩年,魔琺也在持續(xù)推進(jìn) "3D+AI" 的融合落地——推出視頻工具有言、直播產(chǎn)品有光、交互產(chǎn)品有靈,把魔琺星云的技術(shù)能力不斷轉(zhuǎn)化為具體應(yīng)用。

      魔琺星云的推出則進(jìn)一步印證了魔琺從項目到產(chǎn)品再到平臺的轉(zhuǎn)變——

      將 3D 數(shù)字人能力全面開放,讓開發(fā)者和企業(yè)都能快速構(gòu)建具有人類表達(dá)力的具身智能體。

      此外,為了推動不同場景的驅(qū)動落地,魔琺科技創(chuàng)始人、CEO 柴金祥教授表示:

      魔琺具備完整的感知、理解、行動三層能力。對于已有大模型的客戶,魔琺星云提供驅(qū)動與人形智能模塊,實現(xiàn)模型具身化;對于沒有大模型的客戶,則提供從模型到驅(qū)動的一體化解決方案;在線下大屏,對于沒有感知能力的客戶,則提供視覺和語音識別能力;非開發(fā)者用戶也可通過 " 有靈 " 調(diào)用公司模型或第三方通用模型。

      目前,魔琺星云平臺已全面開放給開發(fā)者使用。用戶可以通過SDKAPI接入,實現(xiàn)實時驅(qū)動、語音合成、視頻生成等具身智能能力。

      屏幕上的具身智能體

      長期以來,魔琺科技一直被視為數(shù)字人領(lǐng)域的頭號玩家,但這次新發(fā)布的魔琺星云并非單純的數(shù)字人 / 視頻生成平臺 。

      一方面,與傳統(tǒng)的數(shù)字人平臺不同,魔琺星云不是在 " 合成一段表演 ",而是在 " 驅(qū)動互動 "。

      傳統(tǒng)平臺多基于 2D 拼貼、口型合成與預(yù)錄動作回放,動作有限、響應(yīng)滯后,也缺乏多模態(tài)理解。

      而魔琺星云基于3D 多模態(tài)生成模型,可同時生成語音、表情與動作,使 AI 的交流具備 " 眼神、節(jié)奏與身體語言 " 的層次感。

      另一方面, 與 Sora 等視頻生成模型不同,魔琺星云的目標(biāo)不是生成影像,而是驅(qū)動存在。

      Sora 可以生成逼真的視頻,但輸出不可控、延遲高、成本重——更適合做內(nèi)容,不適合做交互。

      魔琺星云則以低于 1.5 秒的端到端延遲百元級算力的輕量架構(gòu),實現(xiàn)了語義、語音、動作一體化的實時驅(qū)動,讓 AI 能隨語義實時反應(yīng)。

      可以說,Sora 讓 AI" 看起來像人 ",傳統(tǒng)數(shù)字人讓 AI" 聽起來像人 ",魔琺星云則讓 AI" 像人一樣回應(yīng),表現(xiàn) "。

      而這一標(biāo)志性的區(qū)別,正源于魔琺星云此次的獨特定位——具身智能 3D 數(shù)字人。

      簡單來說,具身智能 3D 數(shù)字人就是將數(shù)字人的能力(有形象、會表達(dá))與大模型的能力(有大腦、能辦事)深度融合。

      這里的具身智能體(Embodied Agent)與傳統(tǒng)強調(diào) AI 進(jìn)入物理世界、具備感知和行動能力的具身智能(Embodied AI)不同,更側(cè)重人機交互(HCI)和多模態(tài) AI。

      從最早的紙帶機、終端命令、圖形界面,再到大模型的文本輸入框,交互界面始終缺乏一個 " 活的身體 "。

      具身智能體的提出則在于讓 " 身體能力平臺化 ",讓任何屏幕、界面、應(yīng)用都能擁有身體,從而在具體場景中以自然方式進(jìn)行交互和服務(wù)。

      在這里," 身體 " 不一定是機械的,而是可感知、可體驗的身體界面。

      例如:屏幕上的 3D 數(shù)字人、手機里的虛擬助手、車載屏幕里的 AI 副駕、 接入機器人后的動作與表情驅(qū)動系統(tǒng)。

      這些智能體有表情、有語氣、有手勢——即便身體只存在于屏幕上,也能被人類感知為 " 一個在場的智能體 "。

      相比傳統(tǒng)只能輸出文字或語音的 AI,魔琺星云賦予 AI 更豐富的表現(xiàn)力和自然的交互體驗。

      想象一下:如果 AI 健身教練只能通過文字或語音指導(dǎo),而無法用身體演示動作;如果英語陪練沒有形象,只能讓你對著空氣開口說話——交互體驗必然會大打折扣。

      具身化正是為了解決這個問題:讓終端、應(yīng)用或智能體以人的方式表達(dá)——通過表情傳遞情緒,通過聲音和語氣溝通,通過動作和形象建立存在感。

      只有這樣,交互才能可信,才能規(guī)?;?,才能真正走入社會。

      正如柴金祥教授所說:

      魔琺星云的使命,就是補 AI 最后一塊拼圖讓每一塊屏幕、每一個界面、每一個終端、每一臺人形機器人,都真正 " 活 " 起來。

      此外,從 " 腦到身 " 的視角看,AI 的發(fā)展也可視為具身發(fā)展的演進(jìn)路線。

      文字 AI(ChatGPT):只有語言,沒有身體→無具身

      語音助手(Siri 等):有聲音,可聽不可見→半具身

      數(shù)字人(屏幕):有聲音、有表情、有動作,可感交流→虛擬具身

      機器人:有物理身體,可作用世界→真實具身

      魔琺星云正是貫通了虛擬具身和真實具身,既能驅(qū)動虛擬 3D 數(shù)字人的動作、表情和語音,也能驅(qū)動人形機器人的關(guān)節(jié)動作、面部表情和手勢。

      正因如此,魔琺星云彌合了虛擬世界的大模型 " 有腦卻無身 ",缺乏情緒、動作和表現(xiàn)力,現(xiàn)實世界的人形機器人 " 有身卻無魂 ",能動卻不會交流的鴻溝。

      從這個意義上說,魔琺星云并不只是一個數(shù)字人平臺,而是一次對 " 具身智能 " 概念的重新審視。

      就像柴金祥教授提到的:

      身體是多面向的——既用于感知、日?;顒优c勞動,也可用于娛樂、陪伴與溝通。

      我們當(dāng)前對機器人勞動的關(guān)注,忽略了身體在人交互與情感表達(dá)中的關(guān)鍵作用。

      而魔琺星云的發(fā)布也提醒我們,具身智能的定義與其現(xiàn)有技術(shù)一樣,談收斂,還為時尚早。

      體驗網(wǎng)址:https://xingyun3d.com

      一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」

      歡迎在評論區(qū)留下你的想法!

      點亮星標(biāo)

      科技前沿進(jìn)展每日見

      相關(guān)標(biāo)簽