AI资讯新闻榜单内容搜索-不

新一代记忆智能体框架MIA：让智能体告别「失忆式工作」，在持续进化中变强

如今的大多数智能体，仍然活在一种「失忆式工作」模式中：每一次检索都是从零开始，每一条推理路径都无法沉淀，每一次失败也不会转化为经验。它们虽能多轮交互，但很难在深度研究中持续变强。

来自主题: AI技术研报

9424 点击 2026-04-20 14:02

我给 Claude Code 做了个 AI 硬件监工【附开源地址】

前几天，Anthropic 开源了 claude-desktop-buddy，用一块小屏幕显示 Claude Code 里 Buddy 的状态。结果做着做着，它变成了一个完全不同的东西：M5 Paper Buddy （https://github.com/op7418/m5-paper-buddy）。

来自主题: AI资讯

9848 点击 2026-04-20 10:35

还好我没学剪映，这个 skill 做的视频真不错

身边做短视频的朋友，几乎人手一个剪映。

来自主题: AI资讯

8724 点击 2026-04-20 09:45

读完这份 245 页的报告，我理解了 Anthropic 为什么不发布 Mythos

Anthropic 最强的模型，也是他们不敢发布的模型

来自主题: AI资讯

6627 点击 2026-04-20 09:45

GitHub前创始人拿了a16z的1700万美元，GitButler要做Agent时代的Git

GitButler最近发布的CLI工具引起了我很大的兴趣。这不是一个简单的Git包装器，而是从根本上重新思考了命令行工具应该如何设计。Scott提到了一个有趣的观察：大约80%的开发者仍然使用命令行工具来操作Git，即使有各种GUI工具存在。

来自主题: AI资讯

8043 点击 2026-04-20 09:39

被Claude封号4次后，我决定和几个基友写个“属于中国开发者”的AI工具

过去这半年，AI 圈有个变化特别扎眼：它不再只是能写几行代码，而是开始试图接管整个开发流程，从拆需求、推架构到写代码、修 Bug，一整条链路都在被重塑。过去我们评价一款 AI 编程工具，问的是它能写多少代码？写得够不够好？而现在，大家更关心的是它能不能把事情做完？用起来够不够省心。

来自主题: AI资讯

8228 点击 2026-04-20 09:03

世界引擎：Post-Training开启Physical AGI新纪元

一年前，DeepSeek R1 横空出世，人们才意识到，真正让模型产生推理能力质变的，不必是更大的预训练规模 —— 后训练，用强化学习、过程奖励、闭环反馈，以极低的代价解锁了原本需要数倍算力才能触达的能力边界。

来自主题: AI技术研报

6579 点击 2026-04-20 09:00

全球84%的人从未碰过AI，你以为自己晚了？其实你早得离谱！

一张图在X上炸了：全球84%的人从未真正用过AI，16%偶尔玩玩免费聊天机器人，0.3%愿意每月付20美元，0.04%用AI写代码，0.01%是凌晨跑模型、买硬件的重度玩家。这不是鸡汤，微软官方数据托底。你天天刷AI资讯，以为全世界都在卷——其实你身处的那个圈子，是全球最顶端的0.01%。

来自主题: AI技术研报

8068 点击 2026-04-19 21:47

全世界程序员，都在偷偷给Claude搓硬件

因为 Claude 太好用，硬件的更新似乎都跟不上它的进化速度了，于是程序员们硬是把一个写代码的 AI 工具，玩成了一个「超级 IP」。由于网友太过热情，负责开发 Claude Cowork 的 Felix Rieseberg ，直接在Github 上线了一个支持外设硬件接入的项目：

来自主题: AI资讯

9717 点击 2026-04-19 15:15

SWE-bench满分，0个bug修复：伯克利造了个专门作弊的AI

伯克利团队归纳出7种反复出现的模式：智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。

来自主题: AI技术研报

9002 点击 2026-04-19 13:40