AI资讯新闻榜单内容搜索-全模态

商汤科技全面开源日日新SenseNova-Vision视觉大模型

近日，商汤科技发布并全面开源日日新SenseNova-Vision理解生成统一视觉大模型，试图宣告视觉AI“缝合怪”时代的终结。截至当前，该模型综合得分登顶Hugging Face Any-to-Any Leaderboard，位列该全模态任意输入输出开源模型榜单全球第一。

来自主题: AI资讯

10147 点击 2026-07-16 18:33

C罗刚头球破门，AI解说脱口而出！全模态实时流太狠了

阿里云正式宣布，Apache Flink 3.0全面进入Agentic Streaming For AI时代，并推出全模态数据流处理能力。这是业界第一次，把视频、音频、图像、文本这四类数据，统一放进同一条流式pipeline里调度，让AI能够实时感知、实时理解、实时回应。

来自主题: AI资讯

7752 点击 2026-06-27 12:24

Agnes AI推出无限期免费API后，一周烧出3.12万亿Token！本周再次升级模型服务！

全模态算力狂欢开启：全球前十AI巨头无限期免费API，周调用爆破3.12万亿Token！本周Agnes的王炸升级了：1M超长上下文+4K超清画质「零成本」白嫖，开源社区已玩疯，独立开发者和小团队速来薅秃！

来自主题: AI资讯

9437 点击 2026-06-18 16:05

AI实验室Agnes AI开放全模态不限时免费API！重点是免费！

在这场日益蔓延的“Token焦虑”中，Agnes AI的举动显得格外扎眼——这家全球榜单排名第九的AI Lab宣布，自6月1日起，旗下全模态模型API无限期免费开放。Agnes AI本次开放覆盖其三款核心模型：文本模型Agnes-2.0-Flash、图像模型Agnes-Image-2.0-Flash以及视频模型Agnes-Video-V2.0。

来自主题: AI资讯

13440 点击 2026-06-01 11:24

VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer（Qwen-Image）、混合 AR-DiT（Qwen-Omni）、统一理解 + 生成（BAGEL、HunyuanImage-3.0）等架构。

来自主题: AI技术研报

8124 点击 2026-05-26 10:26

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来正式发布基于新一代原生全模态模型架构 Unified Transformer（UiT）打造的图像大模型 HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模型，不仅在多个基准测试中刷新 SOTA 纪录，也标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。

来自主题: AI资讯

9408 点击 2026-05-25 09:49