腾讯云登上国际BIRD榜单前三,刷新国内NL2SQL最佳成绩

国产ai智能体跻身“nl2sql全球最难榜单”前三。
7月4日,根据国际权威评测平台BIRD-Bench正式发布的最新数据,腾讯云自主研发的数据分析智能体TCDataAgent取得了全球排名第三的优异成绩,超越了包括IBM、Meta在内的多家国际知名企业,成为目前中国在该榜单中取得的最高名次。
来源:BIRD-Bench正式
BIRD-Bench因测试标准严苛而被称为“NL2SQL领域最困难的评测基准”。它不仅要求系统能够将自然语言问题(例如:“查找未通过质检的订单”)准确转换为SQL语句,还要求生成的SQL代码能在真实业务场景中运行,并在存在“脏数据”的大规模数据库上实现高精度和高效的查询结果,这对模型的深层语义理解能力和对数据库内容的感知能力提出了极高的要求。
本次评测覆盖金融、医疗、体育等37个行业应用场景,数据库总容量达33GB,包含超过一万条查询问题。在最新不公开测试数据集的情况下,TCDataAgent最终得分75.74分,位列全球第三,国内第一。
相较于传统NL2SQL方法常常只能基于有限信息“猜测”用户意图,容易因语义模糊或数据结构复杂而出错,TCDataAgent的技术突破在于引入了数据库约束验证机制,能够自动识别并修正SQL语句中的潜在结构性或语义性错误(如连接错误、条件冗余)。
此外,该智能体还能结合数据库实际内容对生成的SQL进行优化,从而显著提升用户意图识别的准确性与翻译结果的可靠性。值得一提的是,TCDataAgent还采用了后训练(post-training)策略,优先选取表现最优的SQL样本来进行模型迭代训练,有效提升了训练样本质量与模型学习过程的稳定性。
TCDataAgent在NL2SQL领域的研究成果也得到了国际学术界的广泛认可,相关论文已被今年数据库领域顶级会议VLDB收录。论文实验结果显示,其核心“数据库内容感知”模块可无缝嵌入其他NL2SQL系统,最高可将查询执行准确率提升18.3%,并在多个主流方案中实现了超过5%的性能提升。
作为腾讯云推出的新一代企业级智能数据分析Agent,TCDataAgent旨在让用户通过自然语言直接对结构化与非结构化数据执行复杂的查询、报表生成及趋势预测等操作,目前已启动内部测试。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
问界M7上市24小时大定破4万,预售19天订单超23万
昨晚,汽车市场迎来一则重磅消息——全新问界M7正式登场,瞬间点燃了消费者的热情。据最新发布的最新战绩海报显示,该车型上市仅5分钟,大定订单就突破了10000台,1小时内这一数字更是飙升至3万台。而在
第四届北斗峰会:聚焦技术融合与全球合作新机遇
第四届北斗规模应用国际峰会在湖南株洲落下帷幕,这场聚焦北斗系统创新应用的盛会,集中展示了北斗技术从“天边”走向“身边”的生动实践。无人机精准作业、人形机器人自主导航、智能手表语音通信……一系列前沿成
百元档主动降噪耳机推荐,十款性价比款横评实测
对于学生群体和日常通勤者而言,挑选一款兼具降噪效果、音质表现和持久续航的耳机,往往需要在预算和性能之间反复权衡。市场上琳琅满目的产品推荐,常常让人难以抉择。为此,一位专注音频设备评测的博主,结合自身
高德刘振飞谈空间智能:赋能行业创新,共筑美好生活
在云栖大会期间举办的2025高德技术峰会上,高德地图董事长刘振飞发表了重要演讲,全面阐释了企业向“空间智能”转型的战略布局与实践成果。他强调,空间智能将成为连接数字世界与物理世界的关键基础设施,其地
OpenAI内部测试GPT-5多模态AI:GPT-Alpha支持跨任务处理
近日,海外科技圈传出重磅消息:OpenAI内部正在对一款名为“GPT-Alpha”的AI智能体进行封闭测试。这款基于GPT-5架构开发的系统,被描述为具备突破性的多模态交互能力,能够同时处理文本、代
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















