今天,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。

有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B。

另一位推特博主「Chubby」对此表示不可思议,「一个以前从来没听过的模型现在成了开源 SOTA,甚至超过了 Qwen 3.7。」

「这让所有人都挺意外。直到今天,巴西当地从业者几乎没人知道这个模型的存在。」

这已经是本周第二个基于 Qwen3.5 做后训练、并跻身前沿水平的模型了。另一个是 Nex-N2-Pro 397B,同样基于 Qwen3.5-397B-A17B 构建,性能可比肩 GPT-5.5 和 Opus 4.7 等顶级模型。

Rio 3.5 的崛起让 Huggingface 联合创始人兼 CEO Clem Delangue 发出了感叹,「AI 的未来没有什么是注定的。接下来会发生,我们每个人都有选择和行动的空间:路径一:闭源 API,权力集中,未来由硅谷和华盛顿少数人决定。路径二:开源 AI,让每个人都能参与、拥有并共同构建,包括里约市这样的机构。选你的路吧,朋友。」

接下来,我们来了解一下 Rio 3.5 397B 模型的技术细节。

Huggingface 地址:https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B#rio-35-open-397b
Rio 3.5 Open 397B 是一款前沿级通用 AI 模型,由里约热内卢市政府旗下的市政 IT 公司 IplanRIO 开发。
该模型基于 Qwen 3.5 397B 进行后训练,在智能体编程、数学、STEM、多语言和多模态等基准测试中达到了开源模型的领先水平,相比基座模型有显著提升,并且能够与全球最强的开源和闭源模型竞争。

模型核心特性包括如下:
其中,SwiReasoning 是一种免训练推理框架,基于 Shi 等人 2025 年的研究,可根据基于熵的置信度信号,在显式思维链推理和潜空间推理之间动态切换。这样既能提升准确率,也能大幅提高 token 效率。该模型在训练时,也明确针对潜空间推理带来的效率增益进行了优化。

论文地址:https://arxiv.org/abs/2510.05069
智能体编程与软件工程基准测试:

知识与推理基准测试:

数学基准测试:

多语言基准测试:

智能体与指令遵循基准测试:

参考链接:
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191
文章来自于微信公众号 “机器之心”,作者 “机器之心”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md