AI资讯新闻榜单内容搜索-模型

仅保留35% Token，性能反超原模型！快手可灵等用视觉信息引导音频压缩，推理时间直降42%

一段几十秒的音视频，上万Token，一半以上是冗余——Omni-LLM的计算浪费，比想象中更严重。

来自主题: AI技术研报

8352 点击 2026-03-11 15:06

视频生成太慢？英伟达、谢赛宁等发布TMD框架，实现70倍加速

近年来，大规模视频扩散模型在视频生成领域取得了显著进展。然而，采样效率低下仍然是这类模型的核心瓶颈。

来自主题: AI技术研报

9080 点击 2026-03-11 15:05

物理AI的「原生」时刻：原力灵机发布具身大模型DM0

当前，大语言模型（LLMs）和视觉语言模型（VLMs）在语义领域的成功未能直接迁移至物理机器人，归根结底在于其互联网原生的基因。

来自主题: AI技术研报

6025 点击 2026-03-11 15:04

不平衡数据下对比学习的理论分析：从训练动态到剪枝解决方案

对比学习已成为表征学习中的一种强大范式，能够在不依赖标签的情况下有效利用无标注数据。

来自主题: AI技术研报

7386 点击 2026-03-11 15:03

CVPR 2026｜清华联合美团推出3DThinker，首个用3D意象思考的工作

大家是否有这样的感觉？给定几张场景中拍摄的图片，往往能够在脑海中想象出这个场景的三维布局，然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示，限制了图像中隐含几何结构的表达能力。

来自主题: AI技术研报

8620 点击 2026-03-11 09:25

扩散模型终于学会「看题下菜碟」！根据提示词难度动态分配算力，简单题省时复杂题保画质

扩散模型终于学会“看题下菜碟”了！

来自主题: AI技术研报

8172 点击 2026-03-11 09:24

可微奖励就该直接微调！用HJB方程颠覆流匹配对齐｜NeurIPS'25

用强化学习微调扩散模型，还有更好的办法吗？

来自主题: AI技术研报

7685 点击 2026-03-11 09:23

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出「ThinkMorph」，主张让文字与图像在统一架构里「原生协作」、「共同演化」，而不是像当下大多数多模态模型那样，看完图像就闭上眼睛，后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型，视觉推理平均提升 34.74%，多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报

6774 点击 2026-03-11 09:22

独家｜杨立昆再联手谢赛宁，英伟达参投，世界模型研究所AMI 已完成 10.3 亿美元融资

3 月 10 日，APPSO 中文独家获悉，世界模型研究所/创业公司 AMI 已完成 10.3 亿美元融资，投前估值 35 亿美元。该公司由图灵奖得主、前 Meta 首席 AI 科学家杨立昆 (Yann LeCun) 创办。

来自主题: AI资讯

8534 点击 2026-03-10 16:20

成立一年半累计融资超 20 亿，这个团队想搞定具身智能最难的「数据瓶颈」

用「无本体数采」的方式训练具身模型，灵初智能的这条路径是 VLA 之后行业最热的方向之一。

来自主题: AI资讯

8214 点击 2026-03-10 15:10