AI资讯新闻榜单内容搜索-视频生成框架

ECCV 2026 | 实时导演多镜头长视频! 港中文&快手可灵发布ShotStream

为了打破多镜头长视频面临的高延迟、零交互困境，香港中文大学与快手可灵团队联合提出了首个实时流式多镜头长视频生成框架 ——ShotStream。该研究打破了传统双向架构的限制，将多镜头合成定义为基于历史上下文的下一镜头生成任务，用户可以通过动态流式提示词在运行时动态指导叙事走向！更令人振奋的是

来自主题: AI技术研报

6369 点击 2026-07-12 10:47

京东开源音视频生成框架JoyAI-Echo，5分钟叙事角色不崩，声音不乱，秒出片

京东首次开源长音视频生成框架JoyAI-Echo。它直击长视频生成中的角色一致性、声音稳定性和生成速度三大核心难题，一举在多个核心指标上超越行业标杆模型。根据公开评测结果，JoyAI-Echo在跨镜头一致性、语音准确率、用户偏好等关键指标上均取得领先表现，与业内主流长视频生成模型相比优势明显，出道即跻身全球第一梯队。

来自主题: AI资讯

9208 点击 2026-06-05 22:06

CVPR 2026 | 1B模型也能当多镜头导演？大连理工&快手可灵开源力作MultiShotMaster

近期，大连理工与快手可灵团队推出了 MultiShotMaster—— 一个高度可控的多镜头视频生成框架，该论文向研究社区展示了即使在 1B 左右的小参数量级模型上，也可以实现导演级的镜头调度和连贯叙事，且支持多图参考、主体运动控制。

来自主题: AI技术研报

9565 点击 2026-03-06 15:06

Light-X来了！全球首个「镜头×光照」双控4D视频生成框架，单目视频秒变电影级

仅凭一段随手拍摄的单目视频，是否能够让镜头在空间中自由飞行，让光线随意变换，让原本固定的真实场景在全新的视角与照明条件下被再次「拍摄」？这一过去被视作科幻设想的问题，如今迎来了明确答案。

来自主题: AI技术研报

10052 点击 2025-12-10 10:21

视频生成Prompt何须仅是文字！字节&港中文发布Video-As-Prompt

视频创作中，你是否曾希望复刻变成 Labubu 的特效，重现吉卜力风格化，跳出短视频平台爆火的同款舞蹈，或模仿复杂有趣的希区柯克运镜？

来自主题: AI技术研报

10982 点击 2025-11-19 09:30

腾讯混元开源游戏AI生成新工具！RTX 4090就能制作3A级动态内容

随手拍的一张图，就能秒变3A级游戏大作？！刚刚，腾讯全新开源游戏视频生成框架Hunyuan-GameCraft，专为游戏环境设计，让任何人都能轻松搞定游戏制作。

来自主题: AI资讯

9302 点击 2025-08-15 14:16

物理视频真实生成！大连理工&莫纳什大学团队提出物理合理的视频生成框架

最近，来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。

来自主题: AI技术研报

7935 点击 2025-04-18 09:08

轨迹可控视频生成新范式，复旦微软破解视频生成难题，精准控制任意物体运动

轨迹可控的视频生成来了，支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。研究人员提出了MagicMotion，一种创新的图像到视频生成框架，共同第一作者为复旦大学研究生李全昊、邢桢，通讯作者为复旦大学吴祖煊副教授。

来自主题: AI技术研报

7369 点击 2025-03-27 09:17

Meta新视频生成框架拿捏倒立杂技，双人舞也能完美同步！运动一致性暴增近20%，可无缝集成DiT模型

针对视频生成中的运动一致性难题，Meta GenAI团队提出了一个全新框架VideoJAM。VideoJAM基于主流的DiT路线，但和Sora等纯DiT模型相比，动态效果直接拉满：

来自主题: AI技术研报

10412 点击 2025-02-10 17:25

UniReal登场：用视频架构统一图像生成与编辑，还学到真实世界动态变化规律

本文中，香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中，通过将不同类别和数量的输入/输出图像建模为视频帧，从大规模真实视频数据中学习属性、姿态、光照等多种变化规律，从而实现高保真的生成效果。

来自主题: AI技术研报

9479 点击 2024-12-20 15:40