AI资讯新闻榜单内容搜索-不

从「对口型」到「会表演」，刚进化的可灵AI数字人，技术公开了

让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的，是当明快的旋律响起，它会自然扬起嘴角，眼神含笑；当进入说唱段落，它会随着鼓点起伏，肩膀与手臂有节奏地带动气氛。

来自主题: AI技术研报

12855 点击 2025-09-16 11:14

氛围编程，正批量制造「AI保姆」。一位15年资深开发者，为赶工用AI编程，结果bug成山不得不推翻重来，痛哭半小时。如今，一种全新职业「氛围编程清理专家」冲上了热榜。

来自主题: AI资讯

8725 点击 2025-09-16 10:57

你有没有想过，为什么我们每天与 ChatGPT 或其他 AI 助手聊天时，从来没有看到过广告？这并不是因为这些公司不想赚钱，而是因为没有人真正搞清楚如何在 AI 对话中优雅地植入广告。

来自主题: AI资讯

10982 点击 2025-09-16 10:37

随着Agent的爆发，大型语言模型（LLM）的应用不再局限于生成日常对话，而是越来越多地被要求输出像JSON或XML这样的结构化数据。这种结构化输出对于确保安全性、与其他软件系统互操作以及执行下游自动化任务至关重要。

来自主题: AI技术研报

8317 点击 2025-09-16 10:19

Nano Banana如此火爆，让谷歌DeepMind CEO哈萨比斯在最新访谈中又一次聊起了AGI。Nano Banana当然不是AGI，但它也体现了哈萨比斯认为AGI系统所需的一些关键能力和特征。

来自主题: AI技术研报

10345 点击 2025-09-16 10:04

这个世界，终于魔幻到我看不懂的程度了。故事是这样的。我最近刷淘宝挺多，然后昨天，鬼使神差的，在淘宝上，搜了一下DeepSeek。没有特定的理由，就是心血来潮，就是单纯的，想看看现在的生态。

来自主题: AI资讯

7844 点击 2025-09-16 10:03

OpenAI o3的多轮视觉推理，有开源平替版了。并且，与先前局限于1-2轮对话的视觉语言模型（VLM）不同，它在训练限制轮数只有6轮的情况下，测试阶段能将思考轮数扩展到数十轮。

来自主题: AI技术研报

9786 点击 2025-09-16 10:02

最近，来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现：在心算任务中，几乎所有实际的数学计算都集中在序列的最后一个token上完成，而不是分散在所有token中。

来自主题: AI技术研报

8484 点击 2025-09-16 10:00

最强不敢说，但最快实锤了！刚刚，xAI发布Grok 4 Fast，生成速度高达每秒75个 token，比标准版快10倍！从下面的动图中，我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”，Grok 4 Fast已经在说：“下一个问题是什么了。”

来自主题: AI资讯

9643 点击 2025-09-15 23:15

就在刚刚，Anthropic 发布了一报告，名字听上去有点学术腔——《人类经济指数》。但别被这个名字骗了，它是一份非常具体、非常当下的观察笔记，可以说和我们息息相关。原文链接：https://ww

来自主题: AI技术研报

10551 点击 2025-09-15 23:12