深度评测智谱 GLM-4.5,到底是什么水平?
深度评测智谱 GLM-4.5,到底是什么水平?这段时间国产 AI 模型非常热闹,各家都瞄着 Coding 和 Agent 场景,开源自己的最新模型。
搜索
这段时间国产 AI 模型非常热闹,各家都瞄着 Coding 和 Agent 场景,开源自己的最新模型。
两个月前,我在文章里第一次提到 Vibe Coding 这个新名词的时候,还在犹豫要不要加几句解释,怕大多数人看不明白。没想到这么快,至少在 AI 圈里,Vibe Coding 已经成了人人都懂的新概念。
新一代大型推理模型,如 OpenAI-o3、DeepSeek-R1 和 Kimi-1.5,在复杂推理方面取得了显著进展。该方向核心是一种名为 ZERO-RL 的训练方法,即采用可验证奖励强化学习(RLVR)逐步提升大模型在强推理场景 (math, coding) 的 pass@1 能力。
超越软件的编程范式革命 长久以来,编程被定义为一种严谨的、逻辑驱动的活动,是将人类意图转化为机器可执行的、确定性指令的过程。然而,AI正在颠覆这一核心定义,将编程从“Coding”这一动作,提升到“表达意图”和“实现愿景”的更高维度。
10天前Amazon发布了他们自己的开发平台,Kiro IDE,其中有一个很厉害的交互功能“Spec(Specification)”,强调的是规范的文档,说明书,以一套非常结构化的方法确保开发过程的系统性、可控性和质量,堪称现代软件工程的最佳实践。让vibe coding有一个规范的范式。
AI Coding太火,微软也坐不住了。 GitHub放大招,新工具GitHub Spark只需自然语言,就能把你的想法变成APP。
Cursor突然断供,码农AI Coding就像被砍掉了手脚!如今,清华系最强平替MonkeyCode站在了C位,不仅性能炸裂、成本超低,还能应对复杂编程任务,首发支持Kimi K2和Qwen3。
任何足够先进的科技,都与魔法无异。—— 亚瑟・克拉克,科幻小说作家、发明家
最近一周,AI Coding产品简直如同井喷。
Vibe Coding 2.0来临,中文就是最热门编程语言!全新ShellAgent横空出世,无需敲代码,几句话即可搞定一个APP。人手一个爆款Agent时代,即将到来。