AI资讯新闻榜单内容搜索-BAGEL

VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer（Qwen-Image）、混合 AR-DiT（Qwen-Omni）、统一理解 + 生成（BAGEL、HunyuanImage-3.0）等架构。

来自主题: AI技术研报

8126 点击 2026-05-26 10:26

深度｜AI互动内容的分水岭时刻，AI娱乐应用贝果要搞一场万人直播挑战极限

李诞带火了一个AI娱乐应用贝果，带着好奇，我第一时间通过内部朋友要到了内测资格。最上头的是贝果的“现实 Online”这个产品。它的玩法听上去极其简单：拿起手机，随手一扫，但就在这短短几秒钟里，整个办公室瞬间就被改造成了一个可以实时探索的游戏空间。

来自主题: AI资讯

11691 点击 2026-05-22 15:46

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

近一年以来，统一理解与生成模型发展十分迅速，该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型（如 Emu3）与单任务的方法差距巨大，Janus-Pro、BAGEL 通过一步一步解耦模型架构，极大地减小了与单任务模型的性能差距，后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。

来自主题: AI技术研报

9226 点击 2025-12-02 15:17