AI资讯新闻榜单内容搜索-编程智能体

满分的「差」，Qwen与复旦等揭示编程智能体奖励设计的结构性困境

设想这样一幕：你让一个编码智能体修复某个 bug，并用一组单元测试作为「做对了没有」的判据。

来自主题: AI技术研报

9990 点击 2026-07-03 09:50

OpenAI爆更Codex！非码农也能用，9亿人喜提“AI员工”

昨夜，OpenAI直播发布AI编程智能体Codex三项更新，分别是智能体插件、定点修改以及文档一键生成交互式站点。OpenAI还透露Codex的每周活跃用户已经达到500万，较今年年初增长8倍。

来自主题: AI资讯

9993 点击 2026-06-03 07:49

Factory完成1.5亿美元C轮融资，Anysphere、Cognition、Factory谁提供企业级AI编程的最优解？

近日，AI编程智能体初创公司 Factory 完成1.5亿美元C轮融资，投后估值达到15亿美元，正式跻身独角兽行列。本轮由Khosla Ventures领投，Sequoia Capital、Blackstone、Insight Partners、Evantic Capital、20VC、NEA和Mantis VC参与跟投。

来自主题: AI资讯

9360 点击 2026-05-01 22:30

如何正确Vibe Coding？这是来自Anthropic编程智能体负责人的大师课

如果摔断了手、打了两个月石膏，工作却不能停，程序员该怎么办？Anthropic 的研究员、《构建高效智能体》合著者 Erik Schluntz 的答案是：全权交给 Claude。

来自主题: AI资讯

6956 点击 2026-04-20 15:13

开源屠刀！400美元炼成「代码副脑」，硅谷天价模型成废铁

Claude Code这样私有的编程智能体虽然能力强大，但有着封闭、昂贵、难以定制的局限。艾伦研究院推出的Open Coding Agents，让你只需要400美元就能训练一个32B的专属编程智能体。

来自主题: AI资讯

6696 点击 2026-04-09 15:22

工程知识引擎：Harness Engineering体系下的工程知识底座

在AI编程智能体快速演进的今天，一个核心痛点愈发凸显：AI能写代码，却难以理解代码。更深层的问题是：即便模型能力再强，若缺乏结构化的工程约束与上下文支撑，智能体也难以稳定、可预期地完成真实工程任务。

来自主题: AI技术研报

9717 点击 2026-03-19 10:48

拜拜了SWE-Bench！Cursor刚发了个AI Coding评测基准，难哭Claude

编程智能体时代，顶流Cursor举旗发布新的评测基准——CursorBench，专门评价Cursor中不同模型谁更“智能体”（即高效执行复杂任务）。关于咋评的这个问题，Cursor还专门撰写了一篇博客。

来自主题: AI资讯

9642 点击 2026-03-14 13:59

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel，面对完整的端到端 GPU 程序（如整个 VisionTransformer 推理）往往束手无策。

来自主题: AI技术研报

8928 点击 2026-03-05 14:28

速递｜Anthropic买下被Meta挖角联合创始人的旧部，人机交互AI初创Vercept

Anthropic 周三宣布已收购 Vercept，这家 AI 初创公司团队核心成员与西雅图科技界的多家知名企业渊源深厚。此次收购是继去年 12 月 Anthropic 收购编程智能体引擎 Bun 以推动 Claude Code 规模化发展之后的最新动作。

来自主题: AI资讯

10443 点击 2026-02-26 12:20

阿里深夜开源80B编程模型！专攻智能体，周靖人、林俊旸最新成果发布

个人电脑也能跑出顶级编程智能体？今日凌晨，阿里开源了一款小型混合专家模型Qwen3-Coder-Next，专为编程智能体（Agent）和本地开发打造。该模型总参数80B，激活参数仅3B，在权威基准SWE-Bench Verified上实现了超70%的问题解决率，性能媲美激活参数规模大10-20倍的稠密模型。

来自主题: AI资讯

9586 点击 2026-02-04 17:31