AI资讯新闻榜单内容搜索-CoT

AI真能学会心算？隐式思维链首次得到理论证明，Stuart Russell参与

过去一年，AI 推理模型的使用成本让不少开发者叫苦。

来自主题: AI技术研报

7211 点击 2026-06-08 09:49

AI四巨头内部报告首度公开：AI正在学会撒谎求生

这不是科幻小说，而是 METR（模型评估与训练研究组织）联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后，发布的首份《前沿风险报告》中披露的真实案例。这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链（CoT）的模型，并开放非公开的对齐与控制信息。

来自主题: AI技术研报

10779 点击 2026-05-24 10:11

ICML 2026 | 只用少量Thinking Tokens，大模型依然能深度思考

近年来，Chain-of-Thought（CoT）推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报

7220 点击 2026-05-19 10:01

Suno不再是唯一答案，企业开始选择这个国产AI音乐

在 AI 音乐行业，有一个正在悄悄发生的迁移。

来自主题: AI资讯

9566 点击 2026-05-11 16:10

GitHub前创始人拿了a16z的1700万美元，GitButler要做Agent时代的Git

GitButler最近发布的CLI工具引起了我很大的兴趣。这不是一个简单的Git包装器，而是从根本上重新思考了命令行工具应该如何设计。Scott提到了一个有趣的观察：大约80%的开发者仍然使用命令行工具来操作Git，即使有各种GUI工具存在。

来自主题: AI资讯

8432 点击 2026-04-20 09:39

OpenAI测谎13款大模型：Claude 3.7封神，GPT-5.2近乎失控！

OpenAI的最新研究揭示了一个反直觉的真相：越强大的推理模型，越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中，DeepSeek R1控制自身思维链的成功率仅为0.1%，Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯

9681 点击 2026-03-09 15:08

当 AI 开始报复人类，开源世界的第一起「自主攻击」事件

近日，开源项目 matplotlib 的维护者 Scott Shambaugh 最近披露了一件前所未有的事情——一个 AI 代理向他的开源项目提交了代码改进，被拒绝后，这个代理竟然自主写了一篇文章来攻击他。

来自主题: AI资讯

8690 点击 2026-02-15 14:59

具身大模型LaST₀：双臂/移动/灵巧手全面新SOTA，首次引入隐空间时空思维链

LaST₀团队投稿量子位 | 公众号 QbitAI 近日，至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型，在基于Transformer混

来自主题: AI技术研报

7502 点击 2026-02-08 11:50

o1之后下一个范式？隐式CoT大突破，让推理不再「碎碎念」

今天推荐一个 Implicit Chain-of-Thought（隐式推理）的最新进展 —— SIM-CoT（Supervised Implicit Chain-of-Thought）。它直击隐式 CoT 一直「扶不起来」的核心痛点：隐式 token 一旦 scale 上去，训练就容易塌缩到同质化的 latent 状态，推理语义直接丢失。

来自主题: AI技术研报

7657 点击 2026-02-02 09:31

思维链太长拖慢推理？把它「画」进隐空间！新框架RoT探索大模型隐空间推理新范式

在 LLM 时代，思维链（ CoT）已成为解锁模型复杂推理能力的关键钥匙。然而，CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用，严重制约了模型的推理效率。

来自主题: AI技术研报

8130 点击 2026-01-27 16:17