AI资讯新闻榜单内容搜索-长视频

ECCV 2026 | 实时导演多镜头长视频! 港中文&快手可灵发布ShotStream

为了打破多镜头长视频面临的高延迟、零交互困境，香港中文大学与快手可灵团队联合提出了首个实时流式多镜头长视频生成框架 ——ShotStream。该研究打破了传统双向架构的限制，将多镜头合成定义为基于历史上下文的下一镜头生成任务，用户可以通过动态流式提示词在运行时动态指导叙事走向！更令人振奋的是

来自主题: AI技术研报

6363 点击 2026-07-12 10:47

从“一句成片”到“长轨推演”：探究多模态智能体在长视频编辑中的应用

近年来，大语言模型（LLMs）在长篇视觉叙事中展现出卓越潜力，生产方式正迅速从单一模型生成转向面向生产的智能体系统。但长视频剪辑仍然是一个极难控制的长期任务。模型有时会在缺乏素材依据的情况下强行生成，甚至在面对明显断档的转场或人物不一致时依然“盲目拼接”。

来自主题: AI技术研报

10016 点击 2026-06-21 10:41

MBench: 清华x腾讯联合定义视频世界模型的长期记忆能力

随着视频生成技术的发展，模型正在从短视频片段合成，向流式长视频生成演进。然而，仅仅做到视觉上的逼真是不够的。一个功能完备的视频世界模型，必须能够在长时序交互中保持稳定的内部状态，并遵循真实世界的物理定律与逻辑规则。

来自主题: AI技术研报

9120 点击 2026-06-11 14:30

京东开源音视频生成框架JoyAI-Echo，5分钟叙事角色不崩，声音不乱，秒出片

京东首次开源长音视频生成框架JoyAI-Echo。它直击长视频生成中的角色一致性、声音稳定性和生成速度三大核心难题，一举在多个核心指标上超越行业标杆模型。根据公开评测结果，JoyAI-Echo在跨镜头一致性、语音准确率、用户偏好等关键指标上均取得领先表现，与业内主流长视频生成模型相比优势明显，出道即跻身全球第一梯队。

来自主题: AI资讯

9203 点击 2026-06-05 22:06