AI资讯新闻榜单内容搜索-强化学习

首个文本到3D生成RL范式诞生，攻克几何与物理合理性

在大语言模型和文生图领域，强化学习（RL）已成为提升模型思维链与生成质量的关键方法。

来自主题: AI技术研报

7155 点击 2025-12-22 09:38

亚马逊AGI负责人离职，强化学习大佬Pieter Abbeel接任

本周四消息，于两年前创立亚马逊 AGI 团队的高级副总裁兼首席科学家 Rohit Prasad 已官宣离职。

来自主题: AI资讯

8733 点击 2025-12-19 11:47

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

近期，强化学习（RL）技术在提升语言模型的推理能力方面取得了显著成效。

来自主题: AI技术研报

7193 点击 2025-12-16 16:26

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

近期，强化学习（RL）技术在提升语言模型的推理能力方面取得了显著成效。

来自主题: AI技术研报

9563 点击 2025-12-16 09:17

全球强化学习+VLA范式，PI*0.6背后都有这家中国公司技术伏笔

在 Physical Intelligence 最新的成果 π0.6 论文里，他们介绍了 π0.6 迭代式强化学习的思路来源：

来自主题: AI技术研报

9721 点击 2025-12-15 09:58

全球首个！灵巧手真实世界具身数采引擎Psi-SynEngine来了，灵初智能发布

灵初智能发布全球首个具身原生人类数据采集方案 Psi-SynEngine。该方案由灵初智能全栈自研，包含便携式外骨骼触觉手套数采套装、大规模 in the wild 数采数据管线、基于世界模型和强化学习的跨本体数据迁移模型，并已率先将采集到的人类数据应用于物流等真实场景。

来自主题: AI资讯

8470 点击 2025-12-11 11:29

只用512张H200！106B模型靠分布式RL杀出重围，全网开源

最近，Prime Intellect正式发布了INTELLECT-3。这是一款拥有106B参数的混合专家（Mixture-of-Experts）模型，基于Prime Intellect的强化学习（RL）技术栈训练。在数学、代码、科学与推理的各类基准测试上，它达成了同规模中最强的成绩，甚至超越了不少更大的前沿模型。

来自主题: AI资讯

9837 点击 2025-12-10 16:14