中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      車東西 18小時前

      理想 5 篇論文中稿頂會!李想發(fā)文祝賀,瞄準(zhǔn)高階智駕落地

      理想汽車持續(xù)投入基礎(chǔ)理論研究。

      作者 | 張睿

      編輯 | 志豪

      理想汽車自動駕駛團(tuán)隊 5 篇論文被世界頂級學(xué)術(shù)會議錄用!包含世界模型、端到端規(guī)劃模型等方面。

      車東西 6 月 30 日消息,近日,理想汽車宣布其自動駕駛團(tuán)隊有 5 篇論文中稿 ICCV 2025。

      ▲理想汽車自動駕駛研發(fā)副總裁郎咸朋宣布中稿

      計算機(jī)視覺國際大會(ICCV,International Conference on Computer Vision)是計算機(jī)領(lǐng)域世界頂級的學(xué)術(shù)會議之一,每兩年舉辦一屆,和 CVPR、ECCV 并稱計算機(jī)視覺三大頂級會議。

      而 2025 年 ICCV 大會共收到了 11239 份有效投稿,為歷史最多,這些投稿經(jīng)過評審后接受 2698 篇論文,接受率為 24%,由此可以看出理想汽車此次多篇論文中稿 ICCV 的含金量。

      理想汽車 CEO 李想也在社交媒體上發(fā)文表示:" 如果大家對 ICCV 論文含金量不太理解,可以類比醫(yī)學(xué)界的《柳葉刀》論文,每一篇都能代表世界級的‘學(xué)術(shù)金牌’。"

      ▲理想汽車 CEO 李想在社交媒體上發(fā)文

      此外,李想還提到,除理想汽車自動駕駛團(tuán)隊中稿的 5 篇論文外,理想汽車基座模型團(tuán)隊還有 3 篇論文中稿,一共 8 篇論文被 ICCV 2025 錄用。

      01.

      Hierarchy UGP:

      用于大規(guī)模動態(tài)場景重建的層次化統(tǒng)一高斯基元

      目前,理想汽車自動駕駛團(tuán)隊中稿的 5 篇論文中,名為《Hierarchy UGP》的論文已經(jīng)公開,這篇論文的是理想汽車與浙江大學(xué)合作在世界模型方面的進(jìn)展。

      ▲《Hierarchy UGP》

      在署名作者中可以看到,理想汽車智能駕駛高級算法專家詹錕、理想汽車高級算法工程師王一達(dá)的名字出現(xiàn)了論文署名中。

      論文中表示,近年來可微渲染技術(shù)的進(jìn)步顯著提升了動態(tài)街景重建的效果。然而,大規(guī)模場景和動態(tài)元素(如車輛和行人)的復(fù)雜性仍是重大挑戰(zhàn),現(xiàn)有方法通常難以擴(kuò)展到大型場景或準(zhǔn)確建模任意動態(tài)。

      為解決這些限制,研究者提出 Hierarchy UGP,其構(gòu)建了由根層級、子場景層級和基元層級組成的層次結(jié)構(gòu),并使用在四維空間中定義的統(tǒng)一高斯基元(UGP)作為表示,實現(xiàn)動態(tài)靜態(tài)長達(dá) 1km 的重建能力。

      具體來看,Hierarchy UGP 的三層分層結(jié)構(gòu)如下:

      1. Root Level(根層):管理整個場景的結(jié)構(gòu),是渲染和優(yōu)化的入口。

      2. Sub-scenes Level(子場景層):將大規(guī)模場景按空間劃分為多個子場景,分別建模天空、背景、剛體和非剛體對象。

      3. Primitive Level(基元層):使用定義在四維時空中的統(tǒng)一高斯基元(UGP)對每個元素進(jìn)行建模。

      ▲ Hierarchy UGP 采用三層分層

      根層級作為層次結(jié)構(gòu)的入口點。在子場景層級,場景在空間上被劃分為多個子場景,并提取各種元素。在基元層級,每個元素通過 UGP 建模,其全局位姿由與時間相關(guān)的運動先驗控制。

      這種層次化設(shè)計極大增強了模型的能力,使其能夠建模大規(guī)模場景。此外,UGP 允許同時重建剛性和非剛性動態(tài)。

      四維高斯建模 UGP 在三維空間基礎(chǔ)上引入時間維度,能夠自然表達(dá)對象的動態(tài)變化,尤其適用于非剛體建模。

      層次細(xì)節(jié)控制(LOD)通過圖像平面投影尺寸選擇渲染基元,提升渲染效率,實現(xiàn)實時渲染。

      子場景并行優(yōu)化采用 " 塊級對象訓(xùn)練策略 ",避免跨子場景動態(tài)對象的干擾,通過 " 時間尺度初始化 " 提升大幅運動區(qū)域的擬合精度。

      虛擬視圖監(jiān)督在新視角合成任務(wù)中引入虛擬視圖監(jiān)督,有效提升外推質(zhì)量。

      在實驗結(jié)果方面,研究者在專有大規(guī)模動態(tài)街景數(shù)據(jù)集 Dynamic City 以及公開的 Waymo 數(shù)據(jù)集上進(jìn)行了實驗。

      Dynamic City 數(shù)據(jù)集是包含以 10 Hz 頻率捕獲的圖像和雷達(dá)數(shù)據(jù)序列,覆蓋 600 米至 1 公里以上的街景。

      與 Waymo 和 PandaSet 等公開數(shù)據(jù)集相比,Dynamic City 數(shù)據(jù)集包含更廣泛的街景,研究者將該數(shù)據(jù)集作為開源資源發(fā)布,以推進(jìn)大規(guī)模動態(tài)街景重建的研究。

      為證明算法的有效性并確保公平比較,研究者進(jìn)行了兩個實驗:一個使用大規(guī)模動態(tài)場景,另一個使用從大規(guī)模場景中提取的子場景。

      下圖中的的表格和圖片結(jié)果表明,對于插值任務(wù),Hierarchy UGP 在大規(guī)模動態(tài)場景和較小的子場景中均始終優(yōu)于現(xiàn)有方法。

      ▲ Hierarchy UGP 在插值任務(wù)上的表現(xiàn)

      此外,通過集成 LOD 技術(shù)和基于 gsplat 的工程增強,Hierarchy UGP 實現(xiàn)了大規(guī)模動態(tài)場景的實時渲染。

      對于外推任務(wù),Hierarchy UGP 顯著優(yōu)于所有其他基線方法。這一改進(jìn)主要歸因于虛擬扭曲視圖的監(jiān)督。

      Waymo 數(shù)據(jù)集是一個真實世界數(shù)據(jù)集,包含在實際道路上收集的數(shù)千個駕駛片段,每個片段包含以 10Hz 采樣的 20 秒傳感器數(shù)據(jù)。

      下圖中圖片的定性結(jié)果表明,Hierarchy UGP 在重建方面優(yōu)于其他方法。

      ▲ Waymo 數(shù)據(jù)集上的定性比較

      具體而言,Hierarchy UGP 在人體物體上實現(xiàn)了顯著更高的視覺指標(biāo),突出了其強大的動態(tài)元素建模能力,即使在大運動區(qū)域也是如此。

      此外,結(jié)果表明 Hierarchy UGP 和 OmniRe 在測試幀上的視覺質(zhì)量下降更為明顯。這種下降發(fā)生是因為在這些幀中,行人運動完全未知,UGP 和 SMPL 都無法完全捕捉行人的運動,導(dǎo)致性能明顯下降。盡管如此,Hierarchy UGP 仍然與最先進(jìn)的方法具有競爭力。

      ▲ Waymo 數(shù)據(jù)集上的定量比較

      最后,研究者們計劃將配套代碼和 Dynamic City 數(shù)據(jù)集作為開源資源發(fā)布,以推動社區(qū)內(nèi)的進(jìn)一步研究。

      02.

      共 8 篇論文中稿

      含端到端模型、渲染框架等多方面

      另外,除了已經(jīng)公開的《Hierarchy UGP》論文,在 ICCV 2025 中理想汽車自動駕駛團(tuán)隊還有 4 篇論文中稿。

      在端到端規(guī)劃模型方面,理想汽車與中國科學(xué)院合作的《World4Drive》論文,提出業(yè)界首個通過自監(jiān)督學(xué)習(xí)實現(xiàn)無需感知標(biāo)注的端到端規(guī)劃模型。

      ▲《World4Drive》

      理想汽車與中山大學(xué)合作的《RoboPerls》論文,利用 3DGS 構(gòu)建面向機(jī)器人操作的可編輯視頻仿真框架,能夠從示范視頻構(gòu)建具有照片級真實感、視角一致的仿真環(huán)境,支持機(jī)器人的數(shù)據(jù)合成。

      ▲《RoboPerls》

      理想汽車獨立完成的《HiNeus》論文,提出了一個統(tǒng)一 3D 復(fù)雜渲染框架,通過三項基礎(chǔ)創(chuàng)新同時解決多視角輻射不一致性、增強低紋理表面恢復(fù)并保留精細(xì)結(jié)構(gòu)細(xì)節(jié)。

      ▲《HiNeus》

      理想汽車與悉尼科技大學(xué)合作的《3D RealCar》論文,提出大規(guī)模真實三維車輛數(shù)據(jù)集 3D RealCar,具備海量數(shù)據(jù)、高品質(zhì)、高多樣性等特性,將有力促進(jìn)三維車輛識別與重建技術(shù)的發(fā)展。

      ▲《3D RealCar》

      除理想汽車自動駕駛團(tuán)隊的論文外,理想汽車基座模型團(tuán)隊還有三篇論文被 ICCV 2025 錄用。

      理想汽車與中國科學(xué)技術(shù)大學(xué)合作《DH-FaceVid-1K: A Large-Scale High-Quality Dataset for Face Video Generation》,提出大規(guī)模高質(zhì)量人臉視頻數(shù)據(jù)集 DH-FaceVid-1K,具備多種族、高質(zhì)量、大容量等特性,可用于訓(xùn)練多模態(tài)數(shù)字人臉視頻生成基座大模型。

      ▲《DH-FaceVid-1K: A Large-Scale High-Quality Dataset for Face Video Generation》

      理想汽車與哈爾濱工業(yè)大學(xué)合作的《QR-LoRA: Efficient and Disentangled Fine-tuning via QR Decomposition for Customized Generation》論文,提出一種全新的圖像定制化微調(diào)范式,可適配現(xiàn)有各種生成模型,訓(xùn)練參數(shù)為普通 LoRA 的一半,微調(diào)速度更快,并能用于多屬性組合生成等定制化場景。

      ▲《QR-LoRA: Efficient and isentangled Fine-tuning via QR Decomposition for Customized Generation》

      理想汽車發(fā)表的《Twig:Growing a Twig to Accelerate Large Vision-Language Models》論文,提出一種自適應(yīng) VLM Token 壓縮 & 推理加速方法,通過分支引導(dǎo)的 Token 剪枝策略 & 自投機(jī)解碼策略,自適應(yīng)地刪除 VLM 模型 LLM 推理階段中和 Query 無關(guān)的 Token,全方位提升 prefill & decode 階段的模型計算效率,在長問答 Task 上可實現(xiàn) 1.5 倍的提速。

      ▲《Twig:Growing a Twig to Accelerate Large Vision-Language Models》

      03.

      結(jié)語:理想汽車持續(xù)投入基礎(chǔ)理論研究

      理想汽車此前已在人工智能領(lǐng)域的頂級學(xué)術(shù)會議和期刊上嶄露頭角。近 3 年,理想汽車圍繞端到端、世界模型、VLA 和基座模型等核心技術(shù),在 AAAI、CVPR、ICRA 等頂級學(xué)術(shù)平臺發(fā)表了近 50 篇論文。

      在基礎(chǔ)理論研究過程中,理想汽車在獨立研究之外,還積極與高校展開合作,能夠充分利用高校的科研資源和人才優(yōu)勢,加速技術(shù)研究進(jìn)程。

      而理想汽車能在輔助駕駛、智能座艙等多方面表現(xiàn)出色,離不開其在底層研發(fā)的長期投入。

      相關(guān)標(biāo)簽

      相關(guān)閱讀

      最新評論

      沒有更多評論了