AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
吞吐提升76%!小红书开源RL训练引擎Relax

吞吐提升76%!小红书开源RL训练引擎Relax

吞吐提升76%!小红书开源RL训练引擎Relax

小红书AI平台团队刚刚开源了Relax——一个为全模态数据、Agentic工作流和大规模异步训练协同设计的现代RL训练引擎!实测全异步Off-Policy模式相比共卡On-Policy吞吐提升76%,相比veRL的全异步实现提升20%!

来自主题: AI技术研报
5978 点击    2026-04-15 09:23
头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

头号玩家照进现实!NTU发布世界模型交互新范式,攻克主动操作难题

南洋理工大学MMLab团队推出Hand2World,让AI世界模型真正「伸手」互动。只需在空中比划手势,模型就能生成逼真第一人称交互视频,实时响应调整。它摒弃旧有遮挡误导,用3D手部结构与射线编码解耦手与头运动,首次实现闭环持续交互。

来自主题: AI技术研报
5594 点击    2026-04-14 15:43
Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

Harness,才是Agent时代统管一切的基座|交大综述解读Memory、Skills、Protocols

2026年再看Agent,一个越来越难回避的事实是:能力正在从模型里流到模型外。真正决定系统上限的,不再只是参数、Prompt和tool calling,而是记忆、技能、协议以及统摄这一切的harness。

来自主题: AI技术研报
8661 点击    2026-04-14 14:57
二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架

随着机器人操作从短程、单步技能逐步走向长程、富接触、需要持续协调与恢复能力的复杂任务,传统以二元成功率为核心的评测方式开始暴露出明显局限。它能够回答 “任务是否完成”,却难以回答 “策略推进到了哪里”“执行过程是否高效稳定”“失败究竟发生在什么阶段”。

来自主题: AI技术研报
8680 点击    2026-04-14 14:57
清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

清华2年前预言,正成为全球共识!Meta等三大AI机构已得出同一结论

太疯狂了!Meta和METR刚测出的AI进化数据,与中国团队两年前提出的「密度定律」完美重合。硅谷猛然回头,发现中国研究者在这条路上已领先两年!

来自主题: AI技术研报
8293 点击    2026-04-14 09:11
全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸

全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸

全错!谷歌实锤AI越乖洗脑越深,现行安全指标沦为废纸

Google DeepMind调查了一万个人,结果让整个AI安全评估体系汗颜:AI做了三倍多的「坏事」,但造成的实际伤害几乎一样。这意味着,我们现在用来证明AI安全的那套逻辑,可能从一开始就是错的。

来自主题: AI资讯
8417 点击    2026-04-14 09:10
统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低

统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低

统一VLA范式!港科大开源StarVLA乐高式架构,复现成本大幅降低

当前具身智能的VLA(Vision-Language-Action)赛道正陷入典型的「碎片化」泥潭:不同团队采用异构的动作解码范式、强耦合的数据管线、互不兼容的评测协议,导致方法难以横向对比,复现成本极高。

来自主题: AI技术研报
8676 点击    2026-04-14 08:42