爱游戏·体育世界杯(中国)官方网站 初度! 小米汽车发布Xiaomi Auto World Model全新框架

[CNMO科技音讯]5月26日,小米汽车崇拜发布XiaomiAutoWorldModel全新框架,为业界缓助驾驶宇宙模子提供了新的框架旅途,鞭策行业从“场景感知”向“默契推演、场景进化”的高阶模式跃迁。

小米汽车
该框架是小米初度将三维重建与视频生成深度耦合的一体化架构,以“重建锚定几何、生成填补思象”的新范式,梗阻行业恒久秉承的重建与生要素离的时间路子。在Waymo、nuScenes等主流基准测试中全面获得SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大中枢场景完成业务落地。

CNMO科技瞩目到,该框架将重建模块(WorldRec)与生成模块(WorldGen)深度耦合。WorldRec通过寥落三维锚点表征,高效构建精准的3D场景几何;WorldGen则在重建拘谨下补全未不雅测区域和将来帧,相沿最长1分钟的视频生成。两者彼此增益,齐备了高踏实性、高一致性、高真正性的协同成果。
在重建鸿沟,WorldRec在公开的Waymo数据集上全面最初此前SOTA举止DGGT,PSNR达到28.48,超出约1个点;在nuScenes零样本泛化测试中照旧保抓最初,爱游戏·体育世界杯(中国)官方网站对新场景允洽能力强。在生成鸿沟,WorldGen在H20GPU上单视角生成速率达0.19秒/帧,三视角为0.46秒/帧,比同为自转头举止的Epona(1.06秒/帧)快5.6倍。相沿高达81帧邻接生成(10Hz/30Hz,最长1分钟),而大大量公开基线仅能生成8-16帧。在nuScenes数据集上,WorldGen获得FVD64.97和FID7.04的收获,FVD见地卓绝了通盘对比的同类模子。


值得一提的是,XiaomiAutoWorldModel已在小米汽车三大骨子场景中落地:
合成数据生成:已录用跨越10万clips高质料合成数据,径直用于感知模子测验,擢升车辆在危急场景下的识别能力。
仿真测试:构建闭环仿真环境,优化测试遵循,可在仿真中复现真正事故进行定向优化。
缓助驾驶学堂:欺诈宇宙模子动态生成第一东说念主称驾驶教会视频爱游戏·体育世界杯(中国)官方网站,现在已上线小米全车型的缓助驾驶学堂-实景模拟场景。