AI资讯新闻榜单内容搜索-通用智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 通用智能体
你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

你的「龙虾」真记得你吗?剑桥发布长期个性化记忆基准ATM-Bench

ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。

来自主题: AI技术研报
9797 点击    2026-04-20 14:36
藏师傅开发的 Codepilot 保姆级入门攻略

藏师傅开发的 Codepilot 保姆级入门攻略

藏师傅开发的 Codepilot 保姆级入门攻略

Codepilot 是藏师傅从今年一月开始纯 Vibe Coding 写个一个全平台通用开源 Agent 客户端。截止目前已经迭代了几百个版本,github 的 Star 也来到了 5100. 支持你能想到的小龙虾和 ClaudeCode 等 Agent 所有的能力,比如:

来自主题: AI资讯
8303 点击    2026-04-10 15:48
万亿思考模型夺下IMO金牌,无缝接入OpenClaw!一句话手搓丐版PS

万亿思考模型夺下IMO金牌,无缝接入OpenClaw!一句话手搓丐版PS

万亿思考模型夺下IMO金牌,无缝接入OpenClaw!一句话手搓丐版PS

万亿级思考模型在开源!Ring-2.5-1T重磅出世,夺下IMO金牌。全新Ling 2.5架构,让它具备了深度思考、长程执行强大能力,真正进化为「通用智能体时代」的基座。

来自主题: AI资讯
8634 点击    2026-02-15 17:02
LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。

来自主题: AI技术研报
10346 点击    2026-01-30 16:05
Chain-of-Agents: OPPO推出通用智能体模型新范式,多榜单SOTA,模型代码数据全开源

Chain-of-Agents: OPPO推出通用智能体模型新范式,多榜单SOTA,模型代码数据全开源

Chain-of-Agents: OPPO推出通用智能体模型新范式,多榜单SOTA,模型代码数据全开源

近年来,以多智能体系统(MAS)为代表的研究取得了显著进展,在深度研究、编程辅助等复杂问题求解任务中展现出强大的能力。现有的多智能体框架通过多个角色明确、工具多样的智能体协作完成复杂任务,展现出明显的优势。

来自主题: AI技术研报
7685 点击    2025-08-23 15:50
刚刚,OpenAI通用智能体ChatGPT Agent正式登场

刚刚,OpenAI通用智能体ChatGPT Agent正式登场

刚刚,OpenAI通用智能体ChatGPT Agent正式登场

ChatGPT 现在可以思考行动,主动选择工具,用自己的虚拟计算机为你完成任务。 Agent AI 时代,比我们想象中来得要早一些。

来自主题: AI资讯
8294 点击    2025-07-18 12:49
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。

来自主题: AI技术研报
8200 点击    2025-06-05 11:50
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式

ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式

ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式

开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。开放世界强调环境的动态性及任务的非预设性,智能体必须具备真正的泛化能力才能稳健应对。然而,现有评测体系多受限于任务多样化不足、任务数量有限以及环境单一等因素,难以准确衡量智能体是否真正「理解」任务,或仅是「记住」了特定解法。

来自主题: AI技术研报
8500 点击    2025-05-14 10:26
Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员

Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员

Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员

“首个通用智能体”Manus背后公司被曝正在硅谷寻求融资——以5亿美元估值,折合人民币37.5亿元,而距离它横空出世也不过才三周时间。从官方消息看,这几天他们确实也在硅谷面对面开用户聚会,据说是场场满员的那种。

来自主题: AI资讯
9163 点击    2025-03-28 09:14