AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
北大发布全球首个「自进化」5D世界模型EvoPhys-World,基于摩尔线程全国产算力底座,以「人」为中心,实现场景级万物可控

北大发布全球首个「自进化」5D世界模型EvoPhys-World,基于摩尔线程全国产算力底座,以「人」为中心,实现场景级万物可控

北大发布全球首个「自进化」5D世界模型EvoPhys-World,基于摩尔线程全国产算力底座,以「人」为中心,实现场景级万物可控

近日,北京大学 EvoPhys 团队推出首个以 “人” 为中心的 “场景级万物可控” 5D 世界模型 EvoPhys-World,基于摩尔线程全国产算力底座,团队首次将 AI 生成世界从 “可观看、可漫游,浅交互” 的阶段,推进到 “可操纵、深交互、自进化” 的新阶段。

来自主题: AI资讯
9002 点击    2026-06-05 15:33
世界模型榜首易主!跨维智能登顶WorldArena

世界模型榜首易主!跨维智能登顶WorldArena

世界模型榜首易主!跨维智能登顶WorldArena

近日,全球具身世界模型权威评测基准 WorldArena 公布最新榜单。在 5 月 25 日截止的最终榜单中,跨维智能登顶 Track 2 赛道全球第一。可以说是,在英伟达、谷歌等全球科技巨头深度布局、重兵把守的世界模型核心腹地,跨维智能实现了强势突围。

来自主题: AI资讯
8291 点击    2026-06-03 15:27
ICML 2026 | 计算所联合ETH研究者提出WorldCache,视频世界模型近似无损提速3.7 倍

ICML 2026 | 计算所联合ETH研究者提出WorldCache,视频世界模型近似无损提速3.7 倍

ICML 2026 | 计算所联合ETH研究者提出WorldCache,视频世界模型近似无损提速3.7 倍

如果说扩散世界模型的瓶颈,是每一步去噪都要把同一个大 Transformer 再跑一遍,那么 WorldCache 的思路就是:不要再把所有 Token、所有时间步都当成同一件事。这篇工作把 “哪些内容适合缓存”和“哪些时刻必须重算” 拆开处理,在不重新训练模型、几乎不增加额外显存的前提下,把缓存真正做成了一套更贴合世界模型结构的推理策略。

来自主题: AI技术研报
6919 点击    2026-06-03 10:02
τ0-WM:最大规模预训练的开源具身世界模型来了

τ0-WM:最大规模预训练的开源具身世界模型来了

τ0-WM:最大规模预训练的开源具身世界模型来了

刚刚,上海创智学院副教授、智元机器人首席科学家罗剑岚带队,发布全球最大规模的开源预训练具身世界模型——τ0-World Model(τ0-WM)。整个τ0-WM参数量达到5B,预训练数据规模高达约3万小时。其中,真机遥操作数据第一次成了绝对主力,占到了1.78万小时。

来自主题: AI技术研报
9242 点击    2026-05-31 19:39
登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

5 月下旬,NVIDIA 联合清华大学、多伦多大学和 Vector Institute 发布 Gamma-World,共一第一为清华大学电子系博士刘芳甫,核心 Research 方向是世界模型和空间智能。

来自主题: AI技术研报
9029 点击    2026-05-30 11:26
刚刚,智元拿下WorldArena世界模型总分冠军!

刚刚,智元拿下WorldArena世界模型总分冠军!

刚刚,智元拿下WorldArena世界模型总分冠军!

WorldArena 世界模型赛道从来都是竞争异常激烈,在经历了前几次比赛过程中的放榜之后,CVPR 2026 WorldArena 世界模型赛道锁定总成绩,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)拿下了最终的冠军,成为了 “强者中的强者”。

来自主题: AI资讯
9129 点击    2026-05-29 21:42
全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

全球首次单机降服万亿巨模DeepSeek-V4!RL后训练框架Orbit开源!

从数学、代码、复杂推理,到多轮工具调用,大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后,RL 不再只是一个算法问题,同时更加是一个系统问题。

来自主题: AI技术研报
6890 点击    2026-05-28 14:51
一个月的活一周干完!英伟达世界模型训练速度飙升400%

一个月的活一周干完!英伟达世界模型训练速度飙升400%

一个月的活一周干完!英伟达世界模型训练速度飙升400%

英伟达世界动作模型 DreamZero 训练一次要烧 8 张 H100 整整 25 天,RLinf 从算子融合到 I/O 全链路系统级重构,把训练吞吐拉高近 4 倍——1 个月的活,1 周就能干完。

来自主题: AI技术研报
6661 点击    2026-05-26 16:04