AI资讯新闻榜单内容搜索-模型训练

吞吐提升76%！小红书开源RL训练引擎Relax

小红书AI平台团队刚刚开源了Relax——一个为全模态数据、Agentic工作流和大规模异步训练协同设计的现代RL训练引擎！实测全异步Off-Policy模式相比共卡On-Policy吞吐提升76%，相比veRL的全异步实现提升20%！

来自主题: AI技术研报

5978 点击 2026-04-15 09:23

试想一下，如果把当下大火的大模型技术带回 1970 年，会发生什么？

来自主题: AI技术研报

8394 点击 2026-04-14 15:45

南洋理工大学MMLab团队推出Hand2World，让AI世界模型真正「伸手」互动。只需在空中比划手势，模型就能生成逼真第一人称交互视频，实时响应调整。它摒弃旧有遮挡误导，用3D手部结构与射线编码解耦手与头运动，首次实现闭环持续交互。

来自主题: AI技术研报

5594 点击 2026-04-14 15:43

文本驱动的人体动作生成是游戏NPC、虚拟主播、机器人控制等实时交互系统的核心技术。

来自主题: AI技术研报

6180 点击 2026-04-14 14:58

2026年再看Agent，一个越来越难回避的事实是：能力正在从模型里流到模型外。真正决定系统上限的，不再只是参数、Prompt和tool calling，而是记忆、技能、协议以及统摄这一切的harness。

来自主题: AI技术研报

8661 点击 2026-04-14 14:57

随着机器人操作从短程、单步技能逐步走向长程、富接触、需要持续协调与恢复能力的复杂任务，传统以二元成功率为核心的评测方式开始暴露出明显局限。它能够回答 “任务是否完成”，却难以回答 “策略推进到了哪里”“执行过程是否高效稳定”“失败究竟发生在什么阶段”。

来自主题: AI技术研报

8680 点击 2026-04-14 14:57

太疯狂了！Meta和METR刚测出的AI进化数据，与中国团队两年前提出的「密度定律」完美重合。硅谷猛然回头，发现中国研究者在这条路上已领先两年！

来自主题: AI技术研报

8293 点击 2026-04-14 09:11

Google DeepMind调查了一万个人，结果让整个AI安全评估体系汗颜：AI做了三倍多的「坏事」，但造成的实际伤害几乎一样。这意味着，我们现在用来证明AI安全的那套逻辑，可能从一开始就是错的。

来自主题: AI资讯

8417 点击 2026-04-14 09:10

过去一段时间，生成理解统一模型（Unified Model）经常被理解成一种「既能看懂图、又能生成图」的多模态通用系统。

来自主题: AI技术研报

8207 点击 2026-04-14 08:42

当前具身智能的VLA（Vision-Language-Action）赛道正陷入典型的「碎片化」泥潭：不同团队采用异构的动作解码范式、强耦合的数据管线、互不兼容的评测协议，导致方法难以横向对比，复现成本极高。

来自主题: AI技术研报

8676 点击 2026-04-14 08:42