AI资讯新闻榜单内容搜索-扩散模型

ISSTA 2026｜LAVE：面向扩散语言模型的约束解码

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

8695 点击 2026-07-16 10:09

过去几年，扩散模型几乎定义了高质量图像生成：从随机噪声出发，经过多轮迭代，逐步 “雕刻” 出一张图像。但随着大语言模型席卷人工智能领域，另一条路线正迅速走到舞台中央 —— 图像，能否也像语言一样，通过自回归方式逐步生成？

来自主题: AI技术研报

7255 点击 2026-07-14 11:07

扩散模型已经越来越会「画」，却还远没有学会「守住要求」。决定系统是否可靠的，已不再只是画质，而是生成结果能否持续遵守条件、维持状态，并符合人类与现实世界的基本标准。

来自主题: AI技术研报

5715 点击 2026-07-02 11:04

扩散模型又被玩出新花样了。

来自主题: AI技术研报

8559 点击 2026-06-25 15:00

扩散模型生成得越来越好，但也越来越慢。

来自主题: AI技术研报

9724 点击 2026-06-22 15:16

大语言模型的RL技术已日趋成熟，多模态生成模型的强化学习训练却仍在“各自为战”——图像扩散模型一套流程、视频生成另一套标准、VLM和LLM又有不同的技术栈。

来自主题: AI技术研报

7501 点击 2026-06-18 11:25

就在刚刚，谷歌闷头干了件大事：把生成图片的扩散模型，拿来写文字了，而且一出手就是4倍加速。新模型名为DiffusionGemma，它直接抛弃了传统自回归那套“逐Token生成”的打字机模式，而是像“印刷机”一样工作——

来自主题: AI资讯

10249 点击 2026-06-11 15:27

今天一早，谷歌又发新模型了！

来自主题: AI资讯

12208 点击 2026-06-11 14:29

在图像到图像翻译（Image-to-Image Translation, I2I）这个任务上，扩散模型过去几年几乎形成了一套默认逻辑：先把输入图像和噪声混合，再一步步去噪，把目标图像 “还原” 出来。

来自主题: AI技术研报

11302 点击 2026-06-10 15:15

近年来，文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image，扩散模型已经能够生成高质量图像，也能处理越来越复杂的文本提示。

来自主题: AI技术研报

9947 点击 2026-06-09 10:02