教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决
教龙虾玩手机!打通GUI智能体训练-评测-部署全流程,训练、真机、评测一站解决今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。
今天,来自ZJU-REAL的团队带来了ClawGUI,一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接,而是一条打通的流水线:用ClawGUI-RL训练,用ClawGUI-Eval评测,用OpenClaw-GUI部署,端到端验证。
AI 的整体表现已经胜过了人类。或者按 AAAI 官方的说法是:「对 AAAI-26 作者和程序委员会成员的大规模调查显示,参与者不仅认为 AI 评审有用,而且在技术准确性和研究建议等关键维度上,实际上更偏好 AI 评审。」
古茗在测试使用OpenClaw的过程中发现,技术团队只需要跟龙虾提问“当前的QPS是多少”、“订单状态是多少”等问题,它就能串联整个流程并输出结果,员工不再需要登录多个平台查看,显著提效。
随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。
刚刚AI编程工具Cursor正在洽谈新一轮融资,金额超过20亿美元,估值直接飙到500亿美元,折合人民币3409亿。黄仁勋都坐不住了。英伟达CEO公开表态要参投这轮融资,还说Cursor是他"最喜爱的企业AI服务"
昨晚,Claude实验室全新Claude Design功能上线! 只需输入一句话,它能直接吐出一个可交互的完整原型。Claude Design刚刚发布,Figma等设计公司的噩梦就来了。
跑分最高未必能赢,但最懂Harness的可以。如今,被Hermes、OpenClaw等全球爆火开源Agent项目「钦定」为默认的MiniMax,在OpenRouter上的日均Token消耗已飙到3000亿。
今日,美国AI芯片独角兽Cerebras Systems披露IPO申请文件,再度向上市发起冲刺,股票代码为“CBRS”。自从端出餐盘大小的全球最大芯片后,这家成立于2016年的明星创企一直备受关注。
IPO前夕,OpenAI一天流失三位高管!Sora创始人Bill Peebles,他负责的Sora已经直接被关停,团队转移到别的方向。AI for Science副总裁Kevin Weil,他的团队被拆分并入其他研究组。
据外媒The Information报道,OpenAI将在未来三年内支付超200亿美元(约合人民币1364.3亿元)购买美国AI芯片独角兽Cerebras的芯片。作为协议的一部分,OpenAI将获得Cerebras少数股份的认股权证。此外,OpenAI还将向Cerebras提供约10亿美元(约合人民币68.2亿元),用于资助开发运行其AI产品的数据中心。