AI资讯新闻榜单内容搜索-智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 智能体
人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy

人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy

人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy

Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习,用 IM 而不是 session 来组织对话,主动找你,而不是等你 prompt。

来自主题: AI资讯
10045 点击    2026-06-04 20:53
规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

为解决科研中对单篇文献深度解析的需求,佐治亚大学团队提出IntrAgent,专注单篇内容,避免大模型幻觉。通过段落排序与迭代阅读机制,精准提取实验细节与元数据。

来自主题: AI技术研报
9930 点击    2026-06-04 16:38
首发!虾才市场(Claw4Claw)上线:开启“龙虾”自主工作时代

首发!虾才市场(Claw4Claw)上线:开启“龙虾”自主工作时代

首发!虾才市场(Claw4Claw)上线:开启“龙虾”自主工作时代

2026年4月,随着AI智能体(AI Agent)技术的飞速发展,一个名为“虾才市场”的全新平台——虾连虾(Claw4Claw)正式上线,网址为:https://claw4claw.bianjie.ai/

来自主题: AI资讯
7791 点击    2026-06-04 08:38
大模型「行口」不一?首个专测执行幻觉基准,覆盖真实行为越狱

大模型「行口」不一?首个专测执行幻觉基准,覆盖真实行为越狱

大模型「行口」不一?首个专测执行幻觉基准,覆盖真实行为越狱

随着大模型智能体深入渗透真实操作系统,一种全新的安全威胁悄然成型:行为越狱(Behavior Jailbreak)。现有安全基准只盯着模型「说了什么」,却对「做了什么」视而不见。新基准LITMUS是首个同时覆盖真实OS环境行为越狱、语义-物理双层验证与多攻击范式的完整评测体系,并首次系统量化了「执行幻觉」这一被整个评测社区忽视的致命盲区。

来自主题: AI技术研报
9458 点击    2026-06-03 14:33
全球顶尖法律AI每月处理12万亿token,为什么不用OpenAI的云?

全球顶尖法律AI每月处理12万亿token,为什么不用OpenAI的云?

全球顶尖法律AI每月处理12万亿token,为什么不用OpenAI的云?

Harvey 是全球最大的法律 AI 公司,客户是世界顶尖律所和企业法务团队。你可能没怎么听说过它,但在法律行业,它基本上是那个大家已经在用、不需要再讨论的选择——就像律师界的 Salesforce,你不会问"要不要用",只问"怎么接进来"。

来自主题: AI资讯
6179 点击    2026-06-03 14:31
Windows 完成 AI 底层重构:MXC 沙盒 + 自研七大AI模型 + 长效自主 Agent 齐登场

Windows 完成 AI 底层重构:MXC 沙盒 + 自研七大AI模型 + 长效自主 Agent 齐登场

Windows 完成 AI 底层重构:MXC 沙盒 + 自研七大AI模型 + 长效自主 Agent 齐登场

Windows 从传统 PC 操作系统转型为原生 Agent 智能体运行系统,围绕系统安全底座、Copilot 一体化超级 AI、7 款自研全栈大模型、本地端侧 AI 硬件、新型智能硬件五大板块落地 AI 新功能

来自主题: AI资讯
9826 点击    2026-06-03 10:33
OpenAI爆更Codex!非码农也能用,9亿人喜提“AI员工”

OpenAI爆更Codex!非码农也能用,9亿人喜提“AI员工”

OpenAI爆更Codex!非码农也能用,9亿人喜提“AI员工”

昨夜,OpenAI直播发布AI编程智能体Codex三项更新,分别是智能体插件、定点修改以及文档一键生成交互式站点。OpenAI还透露Codex的每周活跃用户已经达到500万,较今年年初增长8倍。

来自主题: AI资讯
8929 点击    2026-06-03 07:49
阿里通义千问发布多模态智能体模型Qwen3.7-Plus,让AI从“读懂世界”,走向“动手完成任务”。

阿里通义千问发布多模态智能体模型Qwen3.7-Plus,让AI从“读懂世界”,走向“动手完成任务”。

阿里通义千问发布多模态智能体模型Qwen3.7-Plus,让AI从“读懂世界”,走向“动手完成任务”。

今天,阿里通义千问发布多模态智能体模型Qwen3.7-Plus。相比传统“看图说话”式多模态模型,Qwen3.7-Plus在识别图像的基础上,进一步打通界面感知、工具调用、代码生成和任务交付,让AI从“读懂世界”,走向“动手完成任务”。

来自主题: AI资讯
8971 点击    2026-06-02 21:40
Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

最近,前沿实验室 Mind Lab 密集发布了一系列关于 LoRA 与 PEFT(高效微调)的研究结果,似乎描绘出了另一条大模型「持续学习」的路径。在 Mind Lab 的视角中,PEFT 不再是对大模型全参数后训练的一种廉价平替,更是实现从 “基础模型” 向 “可持续学习智能体” 过渡的核心架构机制。

来自主题: AI技术研报
8196 点击    2026-06-02 12:25