巴西市政IT公司开源大模型杀入全球第一梯队
巴西里约热内卢市政府IT公司IplanRIO基于Qwen3 5-397B-A17B后训练的开源模型Rio3 5397B,在智能体编程、数学等基准测试中超越多数开源模型,跻身全球第一梯队。采用混合专家架构、百万级上下文窗口及SwiReasoning推理框架,性能可媲美顶级闭源模型。
除了全球(非美)市场被禁的 Claude Fable 5 之外,今日 AI 界又被一款开源模型刷屏了——令人意外的是,它竟来自一个几乎没人想到的地方。

推特上的技术分析人士发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型——Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等一众开源模型。更关键的是,该模型的基础模型竟然是基于 Qwen3.5-397B-A17B 构建的。
另一位技术博主「Chubby」对此直呼不可思议:一个此前闻所未闻的模型,如今突然跃升为开源 SOTA,甚至超过了 Qwen 3.7。要知道,直到今天,连巴西当地业内人士也几乎无人知晓这款模型的存在。
这已是本周第二个基于 Qwen3.5 做后训练、并跻身前沿水平的开源模型。前一个名为 Nex-N2-Pro 397B,同样依托 Qwen3.5-397B-A17B 打造,性能可比肩 GPT-5.5 和 Opus 4.7 等顶级模型。
Rio 3.5 的横空出世,让 Huggingface 联合创始人兼 CEO Clem Delangue 都忍不住感叹:AI 的未来充满不确定性。接下来会发生什么,我们每个人都有选择和行动的空间——一条路是闭源 API,权力集中,未来由硅谷和华盛顿少数人决定;另一条路是开源 AI,让每个人都能参与、拥有并共同构建,包括像里约市政府这样的机构。选你的路吧,朋友。
言归正传,我们来详细看看 Rio 3.5 397B 模型到底凭什么脱颖而出。
Rio 3.5 Open 397B 是一款前沿级通用 AI 模型,由里约热内卢市政府旗下的市政 IT 公司 IplanRIO 研发。该模型基于 Qwen 3.5 397B 进行深度优化与强化训练,在智能体编程、数学、STEM、多语言和多模态等基准测试中,均达到了开源模型的领先水平。相比基座模型,其提升效果显著,甚至具备了与全球最强开源、闭源模型正面较量的能力。
它的核心特性包括:
397B 总参数,17B 激活参数,采用混合专家架构(MoE);
1,010,000 token,即百万级上下文窗口;
集成 SwiReasoning:可在显式推理与潜空间推理之间动态切换,在精确度和计算效率之间实现最优平衡;
通用能力强:在智能体编程、推理、指令遵循和多模态任务上表现突出;
多语言能力强:在葡萄牙语、英语、中文及数十种其他语言中均展现出优异表现;
采用 MIT 许可证:完全开放,支持商业及研究用途。
这里重点介绍 SwiReasoning——它是一种免训练推理框架,基于 Shi 等人 2025 年的研究成果,可根据基于熵的置信度信号,在显式思维链推理与潜空间推理之间动态切换。这样做的好处是,既能提升准确率,又能大幅提高 token 使用效率。训练阶段,模型也专门针对潜空间推理带来的效率增益做了深度优化。
智能体编程与软件工程基准测试:
知识与推理基准测试:
数学基准测试:
多语言基准测试:
智能体与指令遵循基准测试:
参考链接:
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:巴西市政IT公司开源大模型杀入全球第一梯队要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点OmniParser是微软AI驱动的SaaS工具,基于YOLOv8和BLIP-2,将UI截图与漫画页面解析为结构化数据,支持UI元素检测、漫画面板分析、对话框及人脸识别,适用于自动化测试、漫画翻译等场景。
通义灵码是贯穿开发全流程的智能编码助手,具备代码智能生成、研发智能问答、多编程语言及编辑器支持、代码安全隐私保障四大核心能力,适用于学生、新手及企业开发者等多类人群,提升编码效率。
基于人工智能的自动化道路巡逻和资产数据收集方案,通过车载相机自动采集路面及周边资产数据,识别裂缝、坑槽等病害并建立数字化台账,同时自动删除隐私图像,实现从被动响应向主动预防的转变,降低巡检成本。
阿里旗下通义智文是一款智能阅读工具,支持网页、论文、图书和自由阅读四种场景,帮助用户快速提取核心观点,节省阅读时间,适合学生、研究人员及职场人士高效处理大量文本。
- 日榜
- 周榜
- 月榜
热点快看
