GPT-5.3爆更前夜,全网都被一张图吓到!ChatGPT人格大赏
GPT-5.3爆更前夜,全网都被一张图吓到!ChatGPT人格大赏一句神秘指令刷屏全网!ChatGPT启用全新「记忆」功能,画出了和人类相处的真相。如今,GPT-5.3已经在路上。
一句神秘指令刷屏全网!ChatGPT启用全新「记忆」功能,画出了和人类相处的真相。如今,GPT-5.3已经在路上。
这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
AI证明数学猜想,这次来真的了。
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。结果?300万行代码。数千个文件。
刚刚,GPT-5.2刷新了一项新纪录!OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。
在人类满分都罕见的普特南数赛上,AI直接12题全对拿满分。陶哲轩等大佬预言AI已经取得了重要里程碑,再加上GPT-5.2 Pro在数学上强到「离谱」的表现,那种「奇点将近」的直觉,真的压不住了。
业界都在讨论的AGI之争,陶哲轩是如何看待的?就在刚刚,陶哲轩po文明确了自己的态度——还不行。他认为,目前还无法实现AGI。
又一个中国新模型被推到聚光灯下,刷屏国内外科技圈。IQuest-Coder-V1模型系列,看起来真的很牛。在最新版SWE-Bench Verified榜单中,40B参数版本的IQuest-Coder取得了81.4%的成绩,这个成绩甚至超过了Claude Opus-4.5和GPT-5.2(这俩模型没有官方资料,但外界普遍猜测参数规模在千亿-万亿级)。
大家好,我是鲁工。 上周发布了一篇关于如何在Antigravity中组合Claude Opus 4.5和Gemini 3 Pro进行交叉验证的文章,读者反馈不错。
作为大模型从业者或研究员的你,是否也曾为一个模型的 “长文本能力” 而兴奋,却在实际应用中发现它并没有想象中那么智能?