AI资讯新闻榜单内容搜索-ACL

阿里荣膺 ACL 2026 最佳资源论文奖，揭示AI Agent的专家能力鸿沟

过去一年，Deep Research Agent 被视为大模型落地的下一个突破口，它们会检索、能用工具、可多步推理，在一个个榜单上高歌猛进。但把它们放到真实世界的专业场景里，表现是否也同样亮眼？

来自主题: AI技术研报

5414 点击 2026-07-20 10:44

Lychee-FD：哈工大张民教授团队在全双工语音大模型领域取得重要突破，斩获ACL 2026杰出论文奖

全双工语音对话是人类最自然的交流方式，是语音对话研究的梦想。相比文本输入，语音天然更接近人的交流方式，但现有语音对话常常停留在 “一问一答、听完再说” 的轮次式交互范式。

来自主题: AI技术研报

9483 点击 2026-07-16 14:55

大模型RL训练为何会「越训越窄」？ACL Outstanding Paper从token-level熵变揭示RLVR训练机制

基于可验证奖励的强化学习（Reinforcement Learning with Verifiable Rewards，RLVR）正在成为大模型后训练的关键技术。数学题能判对错，代码能跑测试，可验证奖励让大模型可以通过强化学习持续提升推理能力。

来自主题: AI技术研报

9944 点击 2026-07-16 10:10

一个人+一个Agent，我把开店要的图全跑通了，方法全公开

大家好，我是冷逸。前段时间，我设计了一家民宿「冷同学的院子」，视觉还算有点意思，不少朋友跑来问设计上的事。也有人问我：要是自己网上开店，有没有那种“够简单、说一句就能出设计”的电商工具？

来自主题: AI产品测评

6347 点击 2026-07-13 09:43

ACL 2026 | 用图异常检测抓出多智能体网络中的内鬼！XG-Guard：首个无监督、可解释、细粒度的MAS安全防线

研究团队提出了 XG-Guard (eXplainable and fine-Grained safeGuarding framework), 一个基于 GAD 且兼具可解释性和细粒度检测能力的无监督安全防护框架。目前工作已被 ACL 2026 Main Conference 接收。

来自主题: AI技术研报

7792 点击 2026-07-11 11:07

竞赛编程Agent进入全球前十！南大、清华新模型CF rating超3500

大语言模型在代码生成上的能力不断增强，但在复杂算法题，尤其是竞赛编程场景中，仍然容易因为算法选择错误、边界条件遗漏、复杂度判断失误或隐藏测试覆盖不足而失败。Solvita是一款面向竞赛编程的智能体框架，通过四个角色（Planner、Solver、Oracle、Hacker）形成闭环系统，并利用可训练的图结构知识网络积累经验。

来自主题: AI技术研报

8764 点击 2026-07-08 15:09

如何判断AI视频真假？综述动态、可溯源、可解释的检测体系 | ACL26

AI视频生成技术迅猛发展，生成内容的逼真度不断提升，现有检测方法已无法满足需求。最新综述提出「事实保真度验证」新目标，从视觉与语言双视角梳理出四层检测框架，涵盖底层线索、时空一致性、跨模态核验及世界知识推理，强调多层证据耦合与可解释性。

来自主题: AI技术研报

7941 点击 2026-07-07 14:56

速递｜AI数据中心Crusoe拟融资30亿美元，估值或达300亿美元，较十月翻三倍

数据中心新秀 Crusoe 与 Meta 和 Oracle 等公司签有为其提供人工智能计算能力的合同，据知情人士称，Crusoe 正就一轮约 30 亿美元的融资进行谈判，此次融资可能使公司的估值翻三倍。

来自主题: AI资讯

9395 点击 2026-07-06 10:30

你的AI正在「见人下菜」，亚马逊团队ACL高分论文，首次系统测评「记忆」如何影响LLM情商

近年来，个性化语言模型迅速普及。从 ChatGPT、Claude 到各类垂直 agent，用户 “长期记忆” 功能也逐渐成为标配，它们被广泛部署在推荐系统、客户服务、情感陪伴等场景中。

来自主题: AI技术研报

9782 点击 2026-06-23 15:03

ICML 2026 Spotlight | AI隐私训练时，那个最难控制的「阀门」能自动调节吗？

近日，来自英国南安普顿大学（University of Southampton）和广州大学的研究者团队提出 SlaClip，一种用于差分隐私随机梯度下降（DP-SGD）[1] 的自适应梯度剪裁方法。

来自主题: AI技术研报

8200 点击 2026-06-19 09:24