AI资讯新闻榜单内容搜索-生成模型

刚刚，创智+模思发布开源版Sora2，电影级音视频同步生成，打破闭源技术垄断

今天上午，上海创智学院 OpenMOSS 团队联合初创公司模思智能（MOSI），正式发布了端到端音视频生成模型 —— MOVA（MOSS-Video-and-Audio）。

来自主题: AI技术研报

8892 点击 2026-01-30 10:39

一张图生成任意场景3D模型，部分遮挡也不怕｜IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架，有望攻克这一问题。它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础，实现了从任意开放世界图像（室内/室外/合成图等）到带Mesh的3D场景的完整重建。

来自主题: AI技术研报

8891 点击 2026-01-26 10:16

国产Nano Banana开源！用华为AI芯片训练，1张图只要1毛钱

今天，首个在国产芯片上完成全程训练的SOTA（最佳水平）多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程，该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。

来自主题: AI资讯

10631 点击 2026-01-14 14:09

AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型，终于让AI视频进入了“无限流”时代。

昨晚夜里快12点，AI视频公司PixVerse毫无预兆的发了一个项目。PixVerse R1，下一代实时世界生成模型。这玩意你看文字，可能不是很好理解，我直接放一个官方的demo视频，大家的感觉应该会强一些。

来自主题: AI资讯

10885 点击 2026-01-14 11:49

从过拟合到通用！ViMoGen开启3D人体动作生成新纪元

随着 AIGC（Artificial Intelligence Generated Content）的爆发，我们已经习惯了像 Sora 或 Wan 这样的视频生成模型能够理解「一只宇航员在火星后空翻」这样天马行空的指令。然而，3D 人体动作生成（3D MoGen）领域却稍显滞后。

来自主题: AI技术研报

9139 点击 2026-01-08 16:13

检索做大，生成做轻：CMU团队系统评测RAG的语料与模型权衡

在检索增强生成中，扩大生成模型规模往往能提升准确率，但也会显著抬高推理成本与部署门槛。CMU 团队在固定提示模板、上下文组织方式与证据预算，并保持检索与解码设置不变的前提下，系统比较了生成模型规模与检索语料规模的联合效应，发现扩充检索语料能够稳定增强 RAG，并在多项开放域问答基准上让小中型模型在更大语料下达到甚至超过更大模型在较小语料下的表现，同时在更高语料规模处呈现清晰的边际收益递减。

来自主题: AI技术研报

8376 点击 2026-01-06 09:30