AI资讯新闻榜单内容搜索-GPT-5

24小时从零写一个GBA模拟器！GPT-5.5跑出53分登顶，Gemini得了0.8分，底部还有两家交白卷

Mechanize 发布了一项硬核测试：给前沿 AI coding agents 24 小时，用 Rust 从零写一个完整的 Game Boy Advance 模拟器，再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报

9674 点击 2026-05-18 16:48

Claude Mythos猛虎出笼！秒破人类一年无解漏洞，GPT-5.5都压不住

就在刚刚，被Anthropic视为「太危险」的绝密大模型Mythos，竟在谷歌云悄悄解禁。CMU最新实测爆出，它在真实漏洞攻防中，断层碾压GPT-5.5。

来自主题: AI资讯

9707 点击 2026-05-17 11:23

国产万亿参数模型Ring-2.6-1T开源！养“龙虾”实力超GPT-5.4

今天，蚂蚁百灵开源旗舰级思考模型Ring-2.6-1T，该模型于5月9日发布，引入了可调节的Reasoning Effort机制，支持high与xhigh两种推理强度，开发者可以根据任务特性动态分配推理资源。

来自主题: AI资讯

10661 点击 2026-05-15 19:55

Gemini 3.5 Pro全网首曝，编程追平GPT-5.5！谷歌终于狠起来了

就在刚刚，Gemini 3.5提前曝光了！网友Lentils放出最新消息，代号「Cappuccino」的Gemini 3.5 Pro检查点已经开始产出。而就在几个小时前，传闻还是Gemini 3.2，没想到一下子就替换成了Gemini 3.5。

来自主题: AI资讯

11939 点击 2026-05-15 16:57

Cyber天花板被打穿！AISI实测Mythos能力正以4.5月翻倍速冲向ASI

英国AI安全研究所（AISI）昨天扔下重磅炸弹：Mythos在模拟企业内网32步渗透任务中10次过6，GPT-5.5也跟着10次过3，连此前所有模型都没破过的Cooling Tower靶场都被首次攻破！更炸的是——Cyber能力翻倍周期一路压到4.5个月，瓶颈不是智力，是Token。这场ASI决赛，人类评测已经追不上AI了。

来自主题: AI资讯

8515 点击 2026-05-15 11:04