蚂蚁数科登顶BIRD全球评测榜首 领先谷歌等科技巨头

9月26日,全球权威技术测评基准BIRD-Bench发布最新成绩单,蚂蚁数字科技的智能数据分析系统Agentar-SQL展现出卓越性能,超越美国电报电话公司(AT&T)、谷歌云、腾讯云等全球科技巨头,荣登榜首。这是中国企业在BIRD-Bench榜单上取得的历史性突破。
作为在全球数据库领域最具公信力的评测标准之一,BIRD-Bench专注于评估AI模型将自然语言指令转化为结构化查询语言(SQL)的能力,并在真实企业级数据库环境下验证执行效果。该基准数据集覆盖金融、能源、医疗卫生等37个重要行业,数据总量达到33GB,收录超过1万项高复杂度查询任务,是检验AI团队技术实力的试金石。
值得注意的是,蚂蚁数字科技的Agentar-SQL系统不仅以81.67分的优异成绩荣登执行准确率排行榜首,同时在执行效率榜单上也以77分拔得头筹。这一双重突破标志着中国企业在大数据分析与智能查询领域已步入全球领先阵营。
技术专家介绍,Agentar-SQL基于蚂蚁自研的SQL大模型架构Agentar-Scale-SQL打造,其独创性的GSPO(组序列策略优化)强化学习算法显著提升了大模型的逻辑推理能力。该系统采用创新的两阶段生成机制:首先生成多个SQL候选方案,随后通过竞技式评估筛选最优解,在保证查询准确率的同时大幅提升执行效率。此外,独特的"多轮反思修正"算法使系统能够反复校验SQL语句,有效避免潜在逻辑错误。
这并非蚂蚁数字科技在AI领域的首次突破。此前,其自主研发的金融推理大模型Agentar-Fin-R1已在多项核心金融测试中取得领先地位;而在新能源领域,专为电力行业优化的时序预测模型的精度更是超越了谷歌TimesFM-V2.0、亚马逊Chronos-Large等国际知名解决方案。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
武大研发聚合物固态电池获重大技术突破
武汉大学集成电路学院杨培华课题组近日在聚合物固态电池研究方面取得重要突破。研究团队成功构建了一种新型阳离子-两性离子聚合物电解质,为开发兼具安全性与高能量密度的固态电池提供了创新思路,相关成果已发表
段永平解释未推荐黄峥加入谷歌真相
9月26日,知名投资人段永平在社交平台回应网友提问时明确表示,他是在黄峥加入谷歌之后才与其相识,因此并未参与或建议黄峥当年选择微软还是谷歌的工作机会。关于外界流传的“段永平推荐黄峥去谷歌”一说,早有
渐冻症治疗新突破:蔡磊眼控科研5年投入超1亿
感谢热心网友的线索分享。9月26日,渐冻症抗争者、攻克渐冻症慈善信托发起人蔡磊昨日通过眼控设备发文回应外界关注。他表示,目前身体已处于五肢瘫痪、无法言语的状态,每日承受压痛、流涎、呛咳、吞咽困难与呼
荣耀Magic8最高补贴1000元,支持友商旗舰换购
9月26日消息,今日,荣耀终端股份有限公司销售与服务总裁王班发文回应大家关注的荣耀“后悔宝”。王班表示,做这件事的初衷特别简单,荣耀深知购买手机是一件需要慎重考虑的事情,旗舰机定价不低,万一买了之后
华擎RX 9070 XT推出怪物猎人限量版显卡
华擎近日与卡普空合作推出了一款专为PC玩家及怪物猎人系列爱好者打造的特别版显卡——AMD Radeon RX 9070 XT 怪物猎人:荒野主题16GB限量版。该产品以游戏中标志性怪物为设计灵感,外
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















