AI资讯新闻榜单内容搜索-GE

给 Agent 用的浏览器 Ego Lite 来了！

最近我在使用的一款浏览器工具叫做 Ego Lite。这款浏览器，是给 Agent 准备的。比如我在 Agent 工具（Codex）里说，在此期间，Ego Lite 的人机交互界面不受任何影响，Agent 也不会打开新的浏览器界面——比如 Codex 操作 Chrome 那样，在你的浏览器里点来点去翻找内容——Agent 只是默默干活，然后给你最终结果。

来自主题: AI资讯

8825 点击 2026-07-13 00:23

万字复盘：从模型到可用Agent，WorkBuddy的Harness工程是怎么做的？

WorkBuddy最近很火，实测下来的体感是，harness层似乎搭建得还不错，而且对国内模型的兼容度都做得很好，少有的国内应用厂商做出来的、基于国产模型的可用Agent产品。这篇文章来自 Work

来自主题: AI资讯

9171 点击 2026-07-12 16:37

Loop 的工程讨论够多了，Loop 理念的产品应该长什么样？

前阶跃 Agent 产品负责人钟十六最近的一篇文章，尝试从产品视角回答这个问题。他描绘了一个 Loop 成熟后的未来图景，Agent 将成为自行运转的项目中心，人只需要在关键时刻现身拍板。在他看来，Loop 真正的价值不在于会重复跑任务，而在于它会带着你的每一次判断持续成长，一轮轮变成更懂你的系统，最终沉淀为长期运转的资产。

来自主题: AI资讯

8524 点击 2026-07-12 10:51

深度测评：Trae、WorkBuddy、ZCode，谁才是打工人真命天子？

我自己花时间，把三款主流国产桌面 Agent 从头到尾测了一遍：Trae、WorkBuddy、ZCode。用三个最日常的工作任务——做 PPT、分析表格、写小游戏，看看它们到底能不能帮普通打工人干活。这篇文章就是完整的实测记录，希望对你选工具有点帮助。

来自主题: AI产品测评

9189 点击 2026-07-12 10:08

GPT-5.6一小时解开50年数学猜想，700词Prompt驾驭64个子Agent

昨儿刚出的GPT-5.6，用不到一小时，就完成了一道存在了半个世纪的图论猜想证明。而这道题呢，来头也还真不小，就是大名鼎鼎的循环双覆盖猜想（Cycle Double Cover Conjecture）。

来自主题: AI资讯

9184 点击 2026-07-11 19:34

全球办公AI王座易主！GPT-5.6接管微软全家桶，数亿打工人集体换脑

微软Copilot & Agents Core总裁Nitin Agrawal说，「迫不及待想让客户看到GPT-5.6能做什么」——不管是起草文档、分析数据、做演示，还是跨团队协作，产出都会更精致。除了原生接入模型，微软还会直接通过OpenAI API调用GPT-5.6，服务Microsoft 365客户。双通道，齐上阵。

来自主题: AI资讯

8019 点击 2026-07-11 19:33

ICML 2026｜小模型也能「指挥」大模型RL后训练：清华&腾讯提出GPS，最高减少69% Rollout成本

来自清华大学与腾讯的研究者提出了 Generalizable Predictive Prompt Selection（GPS）。GPS 的做法很直接：先训练一个小型、可泛化的 Prompt Predictive Model（PPM），让它预测不同 prompt 在当前模型下的难度；再根据难度和 batch 多样性选择训练样本，从而减少无效 rollout。

来自主题: AI技术研报

8274 点击 2026-07-11 11:16

17岁高中生用AI看“眼底照片”筛查自闭症，准确率89%，还拿了110万奖金？

看一张眼底照片，就能判断一个孩子有没有自闭症或多动症风险——这个听起来像科幻的想法，2026 年被一名 17 岁的美国高中生做成了 AI 工具。这款叫 RetinaMind 的模型靠分析视网膜图像给出判断，准确率约 89%，在全美最古老的中学生科学竞赛"Regeneron 科学人才竞赛"上拿了第二名和 17.5 万美元奖金。

来自主题: AI资讯

8769 点击 2026-07-11 11:14

跟AI说“出片穿搭”，它真能听懂！淘宝ShopX让大模型直接“卖货”了

团队提出了ShopX：一个面向agentic shopping的电商大模型。它不仅仅是在搜索框外面套一个会“说话”和“调用工具”的LLM，而是赋予模型直接进入商品空间的能力，让大模型成为商品履约的核心，学会在商品空间中规划、检索、排序、组合和生成结果，进而减少接口损耗。

来自主题: AI技术研报

9341 点击 2026-07-11 11:14

百度搭子重新定义 Agent「托付半径」

今天 APPSO 去了百度在成都举办的 AI DAY「干活吧！搭子」专场，百度搭子一口气抛出三个发布——个人版大升级，企业版正式登场，围绕企业应用，百度还拉起了一个生态联盟。

来自主题: AI资讯

8712 点击 2026-07-10 19:37

AI资讯新闻榜单内容搜索-GE

给 Agent 用的浏览器 Ego Lite 来了 ！

万字复盘：从模型到可用Agent，WorkBuddy的Harness工程是怎么做的？

Loop 的工程讨论够多了，Loop 理念的产品应该长什么样？

深度测评：Trae、WorkBuddy、ZCode，谁才是打工人真命天子？

GPT-5.6一小时解开50年数学猜想，700词Prompt驾驭64个子Agent

全球办公AI王座易主！GPT-5.6接管微软全家桶，数亿打工人集体换脑

ICML 2026｜小模型也能「指挥」大模型RL后训练：清华&腾讯提出GPS，最高减少69% Rollout成本

17岁高中生用AI看“眼底照片”筛查自闭症，准确率89%，还拿了110万奖金？

跟AI说“出片穿搭”，它真能听懂！淘宝ShopX让大模型直接“卖货”了

百度搭子重新定义 Agent「托付半径」

给 Agent 用的浏览器 Ego Lite 来了！