AI资讯新闻榜单内容搜索-生成模型

Z Tech｜师从何恺明，专访 MIT 博士生邓明扬：从 IMO 金牌、IOI 满分的竞赛少年到生成模型研究者

邓明扬现为 MIT 博士生，师从何恺明，主要研究生成模型。本科期间，他在 MIT 学习数学与计算机科学，也曾在 DeepMind 和 Meta 实习。更早之前，他曾获得 IMO 金牌和 IOI 金牌。2026 年，他以第一作者发表了 Drifting Models，尝试探索一种不同于传统路径的生成建模思路。

来自主题: AI资讯

8092 点击 2026-04-21 16:52

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9474 点击 2026-04-16 16:07

合成数据≠生成模型：一文读懂合成数据的全新范式

最新研究提出合成数据的全新分类框架，突破「生成模型=合成数据」的传统认知，涵盖反演、仿真与数据增强等方法，并按应用层次划分为数据中心AI、模型中心AI、可信AI和具身AI。

来自主题: AI技术研报

6691 点击 2026-04-16 16:06

米哈游蔡浩宇AI公司首个视频模型曝光了

米哈游蔡浩宇的AI公司Anuttacon，首个视频模型正式曝光！Anuttacon技术团队成员@Ailing Zeng，在X上展示了全新视频角色表演生成模型——LPM 1.0。

来自主题: AI资讯

8757 点击 2026-04-11 14:30

SVG性能比肩GPT/Claude，腾讯开源3B模型HiVG，让Token「懂几何」

HiVG是一个面向SVG生成的层次化分词框架，在减少63.8% token数量的同时，以仅3B参数在多项指标上超越所有开源SVG模型和GPT-5.2等闭源模型。仅3B参数的HiVG，在SVG生成任务中多项指标超越了GPT-5.2、Claude-4.5-Sonnet等闭源模型。

来自主题: AI资讯

8179 点击 2026-04-10 16:04

告别直接生成，文生图进入Agent时代：港中文联合伯克利开源Gen-Searcher

过去两年，图像生成模型在质感和审美上一路狂飙，但大多仍是 “直接出图” 的范式。

来自主题: AI技术研报

7032 点击 2026-04-10 08:34

跨物体融合新突破！从拼贴到创造：AI学会「生」出新物体

AI不再只是把两个物体「放一起」，而是真正造出一个新实体。VMDiff模型通过分阶段策略：先拼接保留信息，再插值融合成整体，并自动调节平衡，让生成结果既像两者，又自然统一。过去，很多图像生成模型都能同时画出两个物体；但要让它们真正「长成一个新物体」，其实远没有那么简单。

来自主题: AI技术研报

8837 点击 2026-04-04 10:58

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache，刷新多模态生成模型推理加速新基准

FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存（Feature Caching）方案在追求高倍率加速时，常因瞬时速度的剧烈波动导致轨迹漂移。

来自主题: AI技术研报

8610 点击 2026-04-01 16:13

打破具身世界模型可执行性鸿沟！港中深-跨维智能团队提出EVA框架，用强化学习让视频世界模型真正“动”起来

近期，利用视频生成模型为机器人构建 “世界模型”，已成为具身智能领域的热门技术路线。给定当前观测和自然语言指令，这类模型能够先 “想象” 出未来的视觉轨迹，再由逆动力学模型（IDM）将生成画面解码为机器人动作，从而形成 “先预测、后执行” 的解耦式规划范式。由于兼具较强的可解释性与开放场景泛化潜力，这一路线正在受到学术界和工业界的广泛关注。

来自主题: AI技术研报

9099 点击 2026-03-28 09:50

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

过去几年，多模态模型在理解任务上快速演进，图像问答、OCR、视觉推理、跨模态对话等能力不断提升；与此同时，图像生成模型也在视觉质量、指令遵循和细节表达上持续突破。下一步一个自然的问题是：能否用同一个模型，同时做好理解与生成？这正是统一多模态模型（Unified Multimodal Models, UMMs）正在回答的问题。

来自主题: AI技术研报

7638 点击 2026-03-26 14:45

AI资讯新闻榜单内容搜索-生成模型

Z Tech｜师从何恺明，专访 MIT 博士生邓明扬：从 IMO 金牌、IOI 满分的竞赛少年到生成模型研究者

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

合成数据≠生成模型：一文读懂合成数据的全新范式

米哈游蔡浩宇AI公司首个视频模型曝光了

SVG性能比肩GPT/Claude，腾讯开源3B模型HiVG，让Token「懂几何」

告别直接生成，文生图进入Agent时代：港中文联合伯克利开源Gen-Searcher

跨物体融合新突破！从拼贴到创造：AI学会「生」出新物体

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache，刷新多模态生成模型推理加速新基准

打破具身世界模型可执行性鸿沟 ！港中深-跨维智能团队提出EVA框架，用强化学习让视频世界模型真正“动”起来

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

打破具身世界模型可执行性鸿沟！港中深-跨维智能团队提出EVA框架，用强化学习让视频世界模型真正“动”起来