面包屑图标 当前位置: 首页
AI资讯
热点详情

Cohere最新开源AI模型Aya Expanse性能显著超越谷歌及Meta同规格

AI热点日报
AI热点日报时间:2026-06-28
热点解读

最近,Cohere 发布了两个全新的开源 AI 模型,隶属于 Aya 项目。该项目的初衷在于弥补大模型在非英语语言处理上的不足。新模型分别命名为 Aya Expanse 8B 和 35B,目前已在 Hugging Face 开放下载。这两款模型一经推出,便使 23 种语言的 AI 表现实现了显著提升

最近,Cohere 发布了两个全新的开源 AI 模型,隶属于 Aya 项目。该项目的初衷在于弥补大模型在非英语语言处理上的不足。新模型分别命名为 Aya Expanse 8B 和 35B,目前已在 Hugging Face 开放下载。这两款模型一经推出,便使 23 种语言的 AI 表现实现了显著提升。

Cohere新开源AI模型Aya Expanse,能力碾压谷歌、Meta同规模模型

Cohere 在官方博客中指出,8B 参数版本让全球研究人员能够更便捷地应用突破性技术,而 35B 版本则提供了业界领先的多语言能力。实际上,Aya 项目于去年启动,核心目标在于让非英语语言也能受益于基础模型的便利。今年 2 月,他们发布了覆盖 101 种语言的 Aya 101,同时推出了配套的 Aya 数据集,用于辅助其他语言的模型训练。

Aya Expanse 在构建过程中继承了 Aya 101 的多项核心理念。Cohere 表示,此次改进基于多年来对机器学习底层模块的重新审视与突破。他们的研究方向非常明确——缩小语言差距,并取得了若干关键突破,包括数据套利、针对通用性能与安全性的偏好训练,以及模型合并等技术。

在多项基准测试中,Aya Expanse 的两个模型表现十分亮眼。Cohere 称,它们全面超越了 Google、Mistral 和 Meta 等公司同尺寸的 AI 模型。具体而言,32B 版本在多语言基准测试中击败了 Gemma 2 27B、Mistral 8x22B,甚至强于更大的 Llama 3.1 70B;而较小的 8B 版本同样超越了 Gemma 2 9B、Llama 3.1 8B 和 Ministral 8B,胜率区间为 60.4% 至 70.6%。

Cohere新开源AI模型Aya Expanse,能力碾压谷歌、Meta同规模模型

为避免模型生成难以理解或不可靠的内容,Cohere 采用了一种名为“数据套利”的采样方法。该方法在处理低资源语言时尤为出色,能使模型学习效果更佳。此外,他们还专门引导模型向“全球偏好”发展,将不同文化与语言的视角纳入考量,从而在提升性能的同时增强了安全性。

总的来说,Aya 项目旨在让大模型在非英语语言研究领域站稳脚跟。尽管许多大模型最终都会推出多语言版本,但在训练时常常面临数据匮乏的挑战,尤其是针对低资源语言。Cohere 此次的努力,对于构建真正多语言的 AI 模型而言,具有重要的推动作用。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Cohere最新开源AI模型Aya Expanse性能显著超越谷歌及Meta同规格要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://www.1ai.net/22101.html
Cohere新开源AI模型Aya Expanse,能力碾压谷歌、Meta同规模模型

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-02 13:12
谷歌提示词比赛亚军:把AI当同事而非机器

与AI高效协作这件事,最近有个挺有意思的切入点——谷歌和瑞士邮政旗下的Digitalidag联合办了一场提示词比赛,让选手们编写指令,比如让AI制定一份详细的学习计划。亚军得主Joakim Jardenberg赛后接受了专访,分享了不少实操心得。下面这几个核心判断,值得每一位与AI共事的人反复琢磨。

AI热点2026-07-02 13:12
瓴盛打造核心平台与产业生态,加速AIoT场景落地

物联网已成为继智能手机热潮之后,半导体芯片领域最大的应用增长引擎。根据IDC的市场分析报告,中国物联网市场规模增长潜力巨大,预计2022年将超越美国,成为全球最大的物联网市场,占据世界物联网总规模的四分之一以上。按照这一趋势推算,到2025年中国物联网市场规模至少将达到3918亿美元。物联网的核心应

AI热点2026-07-02 13:11
人工智能大模型检索增强生成框架Dify深度解析

在生成式AI技术迅猛发展的背景下,Dify作为一款面向开发者的开源大语言模型应用开发平台,正在深刻改变AI应用的构建方式。它诞生于2023年前后,核心目标非常明确:通过低代码化与模块化设计,使开发者无需从零搭建复杂架构,即可快速部署生产级AI应用。随着大语言模型(LLM)技术的普及,Dify逐渐成为

AI热点2026-07-02 13:11
循序渐进构建MCP服务器教程

这次咱们来拆解一个实际项目:如何基于 TypeScript 构建一个完整的 MCP 服务器。别担心,整个过程会一步步拆开揉碎了讲,从环境搭建到代码实现,再到集成 Claude Desktop 进行测试,一条龙说清楚。 为了不让这个教程显得太干,我们会用一个非常接地气的场景——**天气查询服务**——

延伸阅读