活久见!奥特曼Dario哈萨比斯同仇敌忾:DNA得查了
活久见!奥特曼Dario哈萨比斯同仇敌忾:DNA得查了刚刚,AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人,把名字签在了同一封公开信上。他们联合呼吁美国国会:立法强制筛查所有合成DNA订单。
搜索
刚刚,AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人,把名字签在了同一封公开信上。他们联合呼吁美国国会:立法强制筛查所有合成DNA订单。
今年4-5月,AI信息安全迎来「水门事件级」窗口:攻方落地、守方应急、噪音失控、治理失灵同时暴发。Anthropic主动封印Claude Mythos,只因它强大到必须送进末日火山。
魔法打败魔法的「骚操作」,属实把我看乐了。
科技行业还在收缩,网络安全岗位却抢不到人,连OpenAI也开出44.5万美元高薪招揽安全人才。征兆4月已现:Anthropic的Mythos一个月就挖出超1万个高危漏洞。漏洞发现正被AI加速,网络安全的真正瓶颈,已转向验证与修补。
GPT-5.5 把进攻性网络安全最难的 7 个基准全部打穿,92.4% 正确率,评估体系直接失灵。AI 黑客能力每 6 个月翻一倍,而衡量它有多危险的尺子,已经先被干碎了。
Zero Trust 是一套安全架构,核心前提很简单:不信任任何东西,必须验证一切
Gemini 3.5的闯祸实录。
法国巴黎银行正与法国人工智能初创公司 Mistral AI 及其他合作伙伴合作,为应对 Anthropic 旗下 Mythos 等新模型带来的网络安全威胁做准备。
这不是科幻小说,而是 METR(模型评估与训练研究组织)联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后,发布的首份《前沿风险报告》中披露的真实案例。这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链(CoT)的模型,并开放非公开的对齐与控制信息。
日常聊天可能在不经意间污染个性化Agent的长期记忆,使其在未来任务中偏离用户真实意图。研究人员通过ULSPB基准测试发现,即使无恶意提示,日常对话也可能改变Agent的安全边界。