AI资讯新闻榜单内容搜索-io

AI「看不懂」、「做不好」视频的问题，混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script（MTSS），一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本"，通过 Stream Factorization 和 Relational Grounding 两大核心原则，让视频描述既忠实又可扩展，在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报

7064 点击 2026-04-28 09:57

对话A16z Speedrun唯一语音AI公司Sun：屏幕没法给你真正的个性化，声音可以

a16z Speedrun SR006里有60家公司，57%做B2B。只有一家做Audio。我们和它的创始人Artin聊了45分钟，发现它踩中的东西比看起来大得多。SUN — AI-native audio learning, built around youAI让音频内容的生成成本暴跌80倍，但没有人把这件事变成一个主动为你服务的消费级学习产品

来自主题: AI资讯

8232 点击 2026-04-27 15:18

独家！Soul推出AI语音创作平台“Audio Factory”

《读佳》获知，Soul推出AI语音创作平台“AudioFactory”，基于生成式人工智能模型技术为用户提供丰富、多样的AI功能服务，包括但不限于播客AI生成、语音生成合成、AI生成文案等，具体以播客生成、音色克隆等AI语音功能为主，或为其冲击港股IPO再添技术筹码。

来自主题: AI资讯

8218 点击 2026-04-27 10:30

独家！哈啰切入AI面试赛道，推出“HiOffers AI”

哈啰推出一款AI面试相关的产品“HiOffers AI”，主打AI语音模拟面试、智能简历诊断、JD 精准匹配优化，一站式帮求职者系统性提升面试竞争力，高效拿下Offer。

来自主题: AI资讯

8265 点击 2026-04-27 09:49

ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖

机器之心编辑部 ICLR 2026 获奖论文已经公布。今年共有 2 篇论文获得「杰出论文奖」（Outstanding Paper），另有 1 篇论文获得「荣誉提名」（Honorable Mention）；此外，还有 2 篇 ICLR 2016 论文获得「时间检验奖」（Test of Time Award）。

来自主题: AI技术研报

8999 点击 2026-04-26 12:09

当AI写了80%的代码，谁来找bug？PlayerZero 给你答案

PlayerZero 刚刚宣布完成了 1500 万美元的 A 轮融资，由 Foundation Capital 的 Ashu Garg 领投，他也是 Databricks 的早期支持者。这是继 Green Bay Ventures 领投的 500 万美元种子轮之后的又一轮融资。

来自主题: AI资讯

9631 点击 2026-04-26 10:39

2秒钟转写5分钟音频！国产新语音模型拿下多项SOTA，定价骤减90%

阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景，在架构上引入Multi-Token Prediction（多Token预测）以提升推理效率，并通过扩展上下文窗口强化长内容识别能力。

来自主题: AI资讯

9992 点击 2026-04-25 10:22

独家对话涂鸦“班长”：从AI家庭、机器人到能源，Agent时代需要生态共赢

AI云平台服务提供商涂鸦智能在深圳举办了开发者大会，从AI开发者平台的重磅升级、Hey Tuya、TuyaClaw AI智能体的出色AI交互体验，以及宠物陪伴机器人等AI创新硬件，我们看到涂鸦正全力“All in AI”，全球IoT开发平台也升级为全球AI云开发平台。

来自主题: AI资讯

8687 点击 2026-04-25 10:07

谷歌再发「香蕉」！何恺明等引爆视觉Transformer时刻

最近，谷歌联合ResNet作者何恺明、谢赛宁、NeRF先驱Jonathan T. Barron、 3D图形学名家Thomas Funkhouser，正式发布了Vision Banana。它向世界宣告：视觉AI终于不再需要那些臃肿的任务头了，理解，本质上只是生成过程中的一次「对齐」。

来自主题: AI技术研报

9846 点击 2026-04-24 16:13

前OpenAI工程师团队推出 AI 原生无限视觉浏览器原型Flipbook，颠覆HTML！

想象一下：你打开浏览器，没有代码、没有 HTML、没有 CSS 布局引擎。屏幕上每一帧画面，都是 AI 模型实时生成的像素视频流。满满的科幻降临既视感！这就是 Zain Shah（前 OpenAI、YC 校友）和团队刚刚发布的 Flipbook 原型。

来自主题: AI资讯

11637 点击 2026-04-24 10:46