狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了
狂跑一万帧丝滑不崩!拿着几十块单摄走一圈,整栋楼3D地图建好了SLAM教父罕见公开点赞!中国队开源的LingBot-Map,仅靠普通摄像头实现万帧流式3D重建,在全网引爆120万人围观。
SLAM教父罕见公开点赞!中国队开源的LingBot-Map,仅靠普通摄像头实现万帧流式3D重建,在全网引爆120万人围观。
如果把今天最热门的几个方向摆在一起看,你会发现它们其实在卡同一道坎。
像婴儿一样学习这个世界。
本文主要介绍来自该团队的最新论文:Scalable Object Relation Encoding for Better 3D Spatial Reasoning in Large Language Models。
蚂蚁灵波,下了盘大棋。
今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。作为一款多模态的世界模型,HY-World 2.0支持文字、图片和视频等形式输入,可自动生成、重建并模拟完整的3D世界。
拍一圈照片,就能生成一个可交互的 3D 世界,已经不是什么新鲜话题了。但问题是如何把一个大世界塞进普通人的手机浏览器里。
距离新模型Marble 1.1&1.1-Plus发布不到一个周,李飞飞空间智能独角兽World Labs再度传来新消息—— 开源3D高斯溅射渲染引擎Spark 2.0。
南洋理工大学MMLab团队推出Hand2World,让AI世界模型真正「伸手」互动。只需在空中比划手势,模型就能生成逼真第一人称交互视频,实时响应调整。它摒弃旧有遮挡误导,用3D手部结构与射线编码解耦手与头运动,首次实现闭环持续交互。
前两天我刷到一个工具的时候,第一反应其实不是拿真人照片试,也不是拿潮玩图试。