Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证
Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证惊艳全球的Claude 4,但它到底是如何思考?来自Anthropic两位研究员最新一期博客采访,透露了很多细节。这两天大家可以说是试玩了不少,有人仅用一个提示就搞定了个浏览器Agent,包括API和前端……直接一整个大震惊,与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。
搜索
惊艳全球的Claude 4,但它到底是如何思考?来自Anthropic两位研究员最新一期博客采访,透露了很多细节。这两天大家可以说是试玩了不少,有人仅用一个提示就搞定了个浏览器Agent,包括API和前端……直接一整个大震惊,与此同时关于Claude 4可能有意识并试图干坏事的事情同样被爆出。
字节最近真的猛猛开源啊……这一次,他们直接开源了GPT-4o级别的图像生成能力。不止于此,其最新融合的多模态模型BAGEL主打一个“大一统”, 将带图推理、图像编辑、3D生成等功能全都集中到了一个模型。
最近有两件事,让我对 AI 的价值有了不一样的看法。一件事是前段时间西安一名男子去世后,女儿收拾遗物,在父亲的手机里发现了他在生前和 AI 的对话。「我要去世了,豆包」,是父亲和聊天机器人豆包发出的最后一条信息。
丹麦研究显示,生成式AI推出两年半后尚未显著改变劳动力市场,员工收入与工作时长无明显变化。尽管AI工具提升了部分工作效率(平均节省2.8%时间),但转化为薪资涨幅不足1%。工作内容出现新任务调整,但未减少原有职责,且多数企业将节省时间转化为其他工作量。
在刚刚结束的 Google I/O 开发者大会中,Google 宣布上线由 Gemini 驱动的高级 AI 搜索模式 AI Mode,可以应对复杂问题,支持追问。与之前的 AI Overviews 对 AI 搜索的浅尝辄止不同,Google 终于不再死抱着“关键词+链接列表”,开始拥抱“自然语言交互+结构化答案”的“新”范式了。
英伟达,亲手打破了自己的天花板!刚刚,Blackwell单用户每秒突破了1000个token,在Llama 4 Maverick模型上,再次创下了AI推理的世界纪录。在官博中,团队放出了不少绝密武器。
上月,ChatGPT-4o无条件跪舔用户,被OpenAI紧急修复。然而,ICLR 2025的文章揭示LLM不止会「跪舔」,还有另外5种「套路」。
该项目在今年1 月进一步扩大,Crusoe 与甲骨文签署了更大规模的租赁协议 ,新增 6 个数据中心,覆盖整个 1.2 吉瓦的场地,The Information 率先报道。该协议使甲骨文能为 OpenAI 提供的算力规模翻了两番,额外增加 30 万块 GPU。最初与 Blue Owl 成立的合资企业并不包含此次扩建计划。
极客在创业,小白在买课,画师在失业,但一个尴尬的现实却是:AI 落地热火朝天,但剧情走的不是降临路线,而是掷骰子。极客在创业,小白在买课,画师在失业,但一个尴尬的现实却是:AI 落地热火朝天,但剧情走的不是降临路线,而是掷骰子。
不久前,麦炽科技与广大大在北京举办了一场“AI潮涌·文化共生”的行业论坛。Meta 大中华区行业副总经理 David Chen 陈晶在台上做了一场主题为《AI APP出海:产品、流量、合规三大决胜之道》的演讲。陈晶提到了很多Meta的数据,以及各种投放优势。比如,Meta平均每日活跃用户数为34.3亿,是目前全世界日活最高的平台。