AI资讯新闻榜单内容搜索-智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 智能体
如何正确Vibe Coding?这是来自Anthropic编程智能体负责人的大师课

如何正确Vibe Coding?这是来自Anthropic编程智能体负责人的大师课

如何正确Vibe Coding?这是来自Anthropic编程智能体负责人的大师课

如果摔断了手、打了两个月石膏,工作却不能停,程序员该怎么办?Anthropic 的研究员、《构建高效智能体》合著者 Erik Schluntz 的答案是:全权交给 Claude。

来自主题: AI资讯
6223 点击    2026-04-20 15:13
「部署态」元年,这家公司就把落地方案卷到了七种

「部署态」元年,这家公司就把落地方案卷到了七种

「部署态」元年,这家公司就把落地方案卷到了七种

黄仁勋曾经说过,AI 时代 token 就是货币,那么谁会是 token 最大的消费者?

来自主题: AI资讯
7492 点击    2026-04-20 14:39
Agent不是关键!人大AiScientist实现23小时、74轮长程记忆

Agent不是关键!人大AiScientist实现23小时、74轮长程记忆

Agent不是关键!人大AiScientist实现23小时、74轮长程记忆

中国人民大学团队打造的AiScientist,旨在解决长程机器学习研究工程的持续性难题。该系统从论文理解开始,跨越环境配置、代码实现与实验迭代,保持状态连续与决策连贯,显著提升科研效率。其核心在于通过File-as-Bus机制,稳定保存项目状态,使AI能真正接手科研流程,而非仅辅助单个环节。

来自主题: AI技术研报
7827 点击    2026-04-20 14:36
你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。

来自主题: AI技术研报
9769 点击    2026-04-20 14:36
新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强

新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强

新一代记忆智能体框架MIA:让智能体告别「失忆式工作」,在持续进化中变强

如今的大多数智能体,仍然活在一种「失忆式工作」模式中:每一次检索都是从零开始,每一条推理路径都无法沉淀,每一次失败也不会转化为经验。它们虽能多轮交互,但很难在深度研究中持续变强。

来自主题: AI技术研报
8980 点击    2026-04-20 14:02
Claude Code工程师自曝:100万token上下文窗口是一把双刃剑,上下文腐化,每一步都是一个分叉点,曝内部最佳实践:用回溯代替纠错

Claude Code工程师自曝:100万token上下文窗口是一把双刃剑,上下文腐化,每一步都是一个分叉点,曝内部最佳实践:用回溯代替纠错

Claude Code工程师自曝:100万token上下文窗口是一把双刃剑,上下文腐化,每一步都是一个分叉点,曝内部最佳实践:用回溯代替纠错

最近,Claude Code 团队工程师 Thariq Shihipar又在X上发文了,上个月他写的Skill深度经验分享贴在社交平台爆火,这周他又发了一篇Claude的100万toke上下文窗口使用技巧的文章,平台阅读量已超过200万。

来自主题: AI资讯
9486 点击    2026-04-20 09:02
SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

SWE-bench满分,0个bug修复:伯克利造了个专门作弊的AI

伯克利团队归纳出7种反复出现的模式:智能体和评测程序共享运行环境、标准答案暴露给被测系统、对不可信输入调用eval()、LLM裁判缺乏输入过滤、字符串匹配过于宽松、评分逻辑本身有bug、以及评测程序信任被测系统产生的输出。

来自主题: AI技术研报
8593 点击    2026-04-19 13:40
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决

今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。

来自主题: AI技术研报
7568 点击    2026-04-19 13:33
当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

当AI迈入Harness时代:以MiniMax为样本看智能体云端新基建

2026 年初这几个月,随着 OpenClaw 的爆火,AI 领域也正式步入了 Harness 时代。在这股浪潮中,MiniMax 凭借其敏锐的技术嗅觉,成为了这场变革中的一大核心焦点。

来自主题: AI技术研报
6237 点击    2026-04-17 10:06