AI资讯新闻榜单内容搜索-视频生成模型

机器人需要「看到三维未来」！RynnWorld-4D重塑4D具身世界模型

近两年，视频生成模型在具身智能领域受到持续关注。从 UniPi、SuSIE 到各类 action-conditioned video generation 变体，其核心思路一致：先由模型生成一段未来视频，再从中提取动作信号供机器人执行。

来自主题: AI技术研报

9281 点击 2026-07-17 10:12

所有AI创作工具，都该学学 MVLAND 这个功能

最近《在超市后门抽烟的二人》这部剧挺火的，尤其是里面的音乐我很喜欢，所以就想着做一个真人版音乐短片，正好发现美图旗下的 MVLAND 上线了创意画布模式，接入 Seedance2.0、可灵、HappyHorse 等顶尖视频生成模型。

来自主题: AI资讯

10560 点击 2026-07-05 10:16

刚刚，阿里HappyHorse1.1上线，我用它把国足送进世界杯

今天，阿里巴巴发布了其最新一代视频生成模型HappyHorse 1.1（快乐小马1.1）。阿里称，相比HappyHorse 1.1，这代模型在动态表现力、主体一致性、指令遵循、视觉质感和音频能力等维度有了一定提升。

来自主题: AI资讯

9194 点击 2026-06-22 20:15

给音视频生成打草稿！复旦&腾讯提出Baton：首创语义蓝图指引，实现音画逻辑精准同步

当用户给出一句简单提示词时，当前的音视频生成模型往往已经能够生成具有不错质量的视听内容。然而，一旦提示词变得复杂，问题便开始暴露出来。

来自主题: AI技术研报

10276 点击 2026-06-16 09:54

1080条提示词、7款模型大比拼：视频生成离「好看、好用又准确」还差多少？

当视频生成模型走出娱乐创作的舒适区，进入科学、医疗、教育等知识密集场景，它们是否还能生成事实准确、清晰可用的视频？

来自主题: AI技术研报

10016 点击 2026-06-16 09:53

NEWTON:从「等物理涌现」到「请牛顿进工具箱」，Agent 驱动的视频生成新范式

近年来，视频生成模型发展迅猛。从 Sora、Veo、Kling 到一系列开源视频生成模型，文生视频已经逼近真实影像的观感 —— 画面清晰、镜头流畅、风格可控，一句话就能生成一段观感不错的视频。

来自主题: AI技术研报

10784 点击 2026-06-12 10:13

快手可灵提出VLM-as-Teacher：用测试时在线优化，让视频生成模型学会按规则推理

怎么让VGM学会按规则推理？过去主要有两条路。两条路，一个不动模型，一个只写文字，都没真正解决“执行”问题。为此，城大×快手可灵提出了第三条路：VLM-as-Teacher。

来自主题: AI技术研报

8035 点击 2026-06-06 09:51

京东开源音视频生成框架JoyAI-Echo，5分钟叙事角色不崩，声音不乱，秒出片

京东首次开源长音视频生成框架JoyAI-Echo。它直击长视频生成中的角色一致性、声音稳定性和生成速度三大核心难题，一举在多个核心指标上超越行业标杆模型。根据公开评测结果，JoyAI-Echo在跨镜头一致性、语音准确率、用户偏好等关键指标上均取得领先表现，与业内主流长视频生成模型相比优势明显，出道即跻身全球第一梯队。

来自主题: AI资讯

9205 点击 2026-06-05 22:06

图灵奖得主Sutton新作：AI的下一步，是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟，到 VLA、世界模型等开始进入物理世界，AI 正在不断拓宽其能力边界。

来自主题: AI技术研报

6852 点击 2026-06-02 15:05

现在，豆包能给人“上课”了，还内置Seedance！

对于 Seedance 视频生成模型，大家都不陌生了。

来自主题: AI资讯

9554 点击 2026-06-01 14:57