腾讯云登上国际BIRD榜单前三,刷新国内NL2SQL最佳成绩
发布时间:2025-07-25 编辑:游乐网
国产ai智能体跻身“nl2sql全球最难榜单”前三。
7月4日,根据国际权威评测平台BIRD-Bench正式发布的最新数据,腾讯云自主研发的数据分析智能体TCDataAgent取得了全球排名第三的优异成绩,超越了包括IBM、Meta在内的多家国际知名企业,成为目前中国在该榜单中取得的最高名次。
来源:BIRD-Bench正式
BIRD-Bench因测试标准严苛而被称为“NL2SQL领域最困难的评测基准”。它不仅要求系统能够将自然语言问题(例如:“查找未通过质检的订单”)准确转换为SQL语句,还要求生成的SQL代码能在真实业务场景中运行,并在存在“脏数据”的大规模数据库上实现高精度和高效的查询结果,这对模型的深层语义理解能力和对数据库内容的感知能力提出了极高的要求。
本次评测覆盖金融、医疗、体育等37个行业应用场景,数据库总容量达33GB,包含超过一万条查询问题。在最新不公开测试数据集的情况下,TCDataAgent最终得分75.74分,位列全球第三,国内第一。
相较于传统NL2SQL方法常常只能基于有限信息“猜测”用户意图,容易因语义模糊或数据结构复杂而出错,TCDataAgent的技术突破在于引入了数据库约束验证机制,能够自动识别并修正SQL语句中的潜在结构性或语义性错误(如连接错误、条件冗余)。
此外,该智能体还能结合数据库实际内容对生成的SQL进行优化,从而显著提升用户意图识别的准确性与翻译结果的可靠性。值得一提的是,TCDataAgent还采用了后训练(post-training)策略,优先选取表现最优的SQL样本来进行模型迭代训练,有效提升了训练样本质量与模型学习过程的稳定性。
TCDataAgent在NL2SQL领域的研究成果也得到了国际学术界的广泛认可,相关论文已被今年数据库领域顶级会议VLDB收录。论文实验结果显示,其核心“数据库内容感知”模块可无缝嵌入其他NL2SQL系统,最高可将查询执行准确率提升18.3%,并在多个主流方案中实现了超过5%的性能提升。
作为腾讯云推出的新一代企业级智能数据分析Agent,TCDataAgent旨在让用户通过自然语言直接对结构化与非结构化数据执行复杂的查询、报表生成及趋势预测等操作,目前已启动内部测试。
相关阅读
MORE
+- 华硕主板BIOS功能详解及安全升级操作指南 07-25 Windows系统安装失败蓝屏代码0x0000007B如何排查修复? 07-25
- 如何通过夸克AI大模型运营社群赚钱 夸克AI大模型自动生成社群内容 07-25 Office激活永久有效 Office专业增强无广告畅用版 07-25
- 如何结合豆包AI实现AIGC工作流 豆包AI自动创作流程整合技巧 07-25 百度贴吧网页版入口(官方网址链接分享) 07-25
- 讯飞星火AI如何帮助自媒体写作?高效产出指南来了 07-25 如何用夸克AI大模型打造虚拟写作工作室 夸克AI大模型服务接单商业化 07-25
- 如何基于夸克AI大模型构建知识问答 夸克AI大模型自定义知识库训练 07-25 如何在DeepSeek中设置个性化偏好?如何让AI更符合你的使用习惯? 07-25
- 怎样将 AI 音乐创作工具与豆包联用谱出动人旋律?一文讲透 07-25 新手如何使用AI语言工具做知识型短视频内容 07-25
- 玩转 Deepseek 满血版和 Murf Studio,制作有声读物音频 07-25 不露脸不剪辑也能做短视频?AI语言转视频的玩法来了 07-25
- 解读AI剪辑对传统视频后期行业带来的冲击与机会 07-25 Safari浏览器打开链接特别慢是怎么回事 这样设置轻松解决Safari浏览器访问问题 07-25
- 豆包AI的「语音识别」不灵敏如何优化?灵敏度调整与引擎选择 07-25 【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战 07-25
热门合集
MORE
+猜你喜欢
MORE
+变态游戏推荐
MORE
+最新专题
MORE
+热门游戏推荐
MORE
+-
2 生存战争突变末日 角色扮演
-
3 热血合击 其他游戏
-
4 芭比梦幻屋 休闲益智
-
5 全民绳索营救 休闲益智
-
6 美男恶徒在暗夜中展开的恶爱 剧情养成
-
7 斗罗大陆比比东篇免费 角色扮演
-
8 恋爱与选举与巧克力资源 剧情养成
-
9 森林之子 动作冒险
-
10 宝宝医院 休闲益智