AI资讯新闻榜单内容搜索-ICL

ICLR 2026 Oral | 大道至简！斯坦福、英伟达、新国立联合推出InfoTok，用信息论重新定义高效视频分词

在生成式 AI 领域，视觉分词器（Visual Tokenizer）通常采用固定压缩率 —— 无论是单调的监控画面，还是复杂的动作大片，都被切分为等量的 Token。这种 "一刀切" 的做法不仅会造成巨大的计算冗余，也产生了 “信息量” 不同的 Token，不利于下游理解生成任务处理。

来自主题: AI技术研报

6132 点击 2026-03-31 10:03

VLM解几何题总翻车？GEODPO从「看」入手：用结构化表示+DPO优化，让模型先看懂再推理丨ICLR'26

几何问题，真的只是“推理难”吗？

来自主题: AI技术研报

8225 点击 2026-03-31 10:02

ICLR 2026 | 让多模态模型学会主动说话：主动交互从训练到评估的完整方案

本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文，介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复，而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark，MMDuet2 则通过强化学习训练方法实现了 SOTA 性能，无需精确的回复时间标注即可训练出及时、准确的主动交互模型。

来自主题: AI技术研报

9201 点击 2026-03-30 15:02

连续两篇 ICLR，南京大学林浩鑫将世界模型动力学推演推进到上千步

当世界模型越来越大，真正制约它走向「内部模拟器」的，未必是表征能力，而可能是动力学建模。

来自主题: AI技术研报

7872 点击 2026-03-30 09:29

刚刚，实验室被一只「科研龙虾」接管！通宵爆肝论文，还能帮你发顶刊

广大科研人们，属于你们的科研龙虾SciClaw横空出世了！用它接管深夜的实验室，博士僧们终于可以睡个好觉了。

来自主题: AI资讯

8976 点击 2026-03-26 15:25

刷榜多元时序预测，性能波动0%！打破CI/CD二元对立 | ICLR'26

ICLR'26新研究CPiRi打破时序预测僵局：用冻结底座提取时序特征，轻量模块专注学习通道间真实关系，不靠位置编码「背答案」。测试中通道乱序性能零波动，仅用25%数据即可泛化至全网络，真正实现鲁棒与精准双赢。

来自主题: AI技术研报

7728 点击 2026-03-26 10:50

ICLR 2026 | ESC — 解构一步生成，厘清细节，探寻本质

近期，基于捷径化概率流路径（shortcut probability flow trajectory）并从头训练的一步扩散生成模型，展现出强大的实证有效性。然而，这类方法的提出通常建立在较为复杂的理论推导之上，并且往往与具体实现细节高度耦合。这带来一个直接的问题：究竟哪些设计是方法成立的本质要素，哪些又只是可以灵活替换的实现组件。

来自主题: AI技术研报

7683 点击 2026-03-24 17:19

告别AI「鬼画符」！一行指令「复活」王羲之、苏轼，带连笔、懂排版，项目已开源丨ICLR'26

苦于AI单字拼凑没行气，或是排版秒变“鬼画符”？

来自主题: AI技术研报

7056 点击 2026-03-23 13:44

ICLR 2026 | Shop-R1: 给AI补上「内心戏」，在RL博弈中复刻人类网购脑

传统的 AI 购物助手更像是一个任务完成机器：接到指令，搜索，下单。他们或许能跑通流程，却完全无法理解用户为何在最后一刻因为一条关于 “夹耳朵” 的差评而放弃支付。简而言之，传统的电商 Agent 只是任务导向的（task-oriented），而不是模拟导向的（simulation-oriented）。为此，来自亚马逊（Amazon）的研究团队提出了名为 Shop-R1 的训练框架。

来自主题: AI技术研报

7859 点击 2026-03-21 09:28

超越MLA！新架构MLRA百万token，解码最高2.8倍速 | ICLR'26

MLRA通过拆分KV缓存为四个并行分支，显著降低显存占用并实现4路张量并行。推理速度比MLA最高快2.8倍，支持百万级上下文，且模型质量更优。无需牺牲性能，即可高效扩展长文本处理能力。

来自主题: AI技术研报

10721 点击 2026-03-19 15:25