AI资讯新闻榜单内容搜索-Traini

来自MIT的最新研究-RL's Razor｜展望LLMs Post-Training下的前沿探索与思考

来自MIT Improbable AI Lab的研究者们最近发表了一篇题为《RL's Razor: Why Online Reinforcement Learning Forgets Less》的论文，系统性地回答了这个问题，他们不仅通过大量实验证实了这一现象，更进一步提出了一个简洁而深刻的解释，并将其命名为 “RL's Razor”（RL的剃刀）。

来自主题: AI技术研报

8168 点击 2025-09-18 14:26

OpenAI内部大重组！模型行为团队并入Post Training，负责人另起炉灶

OpenAI又要成立新团队了！

来自主题: AI资讯

9354 点击 2025-09-08 17:19

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

OpenAI重磅结构调整：ChatGPT「模型行为」团队并入Post-Training，前负责人Joanne Jang负责新成立的OAI Labs。而背后原因，可能是他们最近的新发现：评测在奖励模型「幻觉」，模型被逼成「应试选手」。一次组织重组+评测范式重构，也许正在改写AI的能力边界与产品形态。

来自主题: AI技术研报

10389 点击 2025-09-07 12:20

AI破解宠物心声，读懂你的猫狗？全球首个AI与动物感知中心揭秘

伦敦政治经济学院的Jeremy Coller动物感知中心以400万英镑的资助，集结神经科学、哲学与AI专家，研究从猫狗到章鱼的动物意识。研究中心正用科学揭开动物意识之谜，探索AI在宠物交流中的潜力与风险。

来自主题: AI资讯

8726 点击 2025-07-25 18:07

大模型竞赛转向：决胜关键为何是“后训练”？

随着基础大模型在通用能力上的边际效益逐渐递减、大模型技术红利向产业端渗透，AI的技术范式也开始从原来的注重“预训练”向注重“后训练”转移。后训练（Post-training），正从过去锦上添花的“调优”环节，演变为决定模型最终价值的“主战场”。

来自主题: AI技术研报

9103 点击 2025-07-20 12:30

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

近年来，随着扩散模型（Diffusion Models）和扩散 Transformer（DiT）在视频生成领域的广泛应用，AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型，已经能够生成结构清晰、细节丰富且高度连贯的长视频内容，为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变革。

来自主题: AI技术研报

8874 点击 2025-07-14 10:42