04年北大「小天才」押注世界基座模型,要造中国版Neo Lab|对话逆矩阵陈博远
04年北大「小天才」押注世界基座模型,要造中国版Neo Lab|对话逆矩阵陈博远不与世界交手,何以理解世界?
不与世界交手,何以理解世界?
多模态大模型的研发范式,正在被彻底重构。
还记得那个穿着「Lululemon」紧身衣、主打温柔陪伴的家用人形机器人 NEO 吗?
2025 年 9 月,The Information 报道 Anthropic 曾讨论在接下来一年内投入超过 10 亿美元用于 RL 环境建设。Epoch AI 最近发了一篇报告,采访了 18 位来自 RL 环境初创公司、neolab(Cursor 这类应用型 AI 公司)和前沿实验室的从业者
当全行业还在为昂贵的多视角数据焦头烂额时,中科院和CreateAI重磅推出NeoVerse,直接用百万单目视频砸开了4D世界模型的大门,让AI真正学会了理解开放世界。
我们在《RoboNeo 拿下百万 MAU,净利润再次大涨 70%,有 AI 加持的美图开挂了?》中分析过美图的财报,从业绩看,美图在生产力场景主要的成绩在于付费率的提升,而在生活场景的亮点则是海外增长。
全球首个可大规模落地的开源原生多模态架构(Native VLM),名曰NEO。要知道,此前主流的多模态大模型,例如我们熟悉的GPT-4V、Claude 3.5等,它们的底层逻辑本质上其实玩的就是拼接。
当机器人也开始找人代班,当一个人类操作一个机器人「入侵」你的生活,你会允许吗?
当下主流的视觉语言模型(Vision-Language Models, VLM),通常都采用这样一种设计思路:将预训练的视觉编码器与大语言模型通过投影层拼接起来。这种模块化架构成就了当前 VLM 的辉煌,但也带来了一系列新的问题——多阶段训练复杂、组件间语义对齐成本高,不同模块的扩展规律难以协调。
全球首款开卖的家务人形机器人来了!