首页
AI
三星TRUEBench发布:专为AI设计的性能评测工具

三星TRUEBench发布:专为AI设计的性能评测工具

热心网友
转载
2025-09-26
来源:https://www.ithome.com/0/885/815.htm

9月25日最新消息显示,三星再次展现其在移动AI领域的创新实力。作为全球首个在智能手机端集成全方位AI功能的厂商,三星始终保持着每半年迭代更新AI功能的技术节奏。近日公司正式发布自主研发的人工智能评测系统——TRUEBench。

三星发布TRUEBench测试工具

根据三星研究院最新公告,这款名为"可信真实场景使用评估基准"(TRUEBench)的专业评测工具,是其针对现有AI测试缺陷专门开发的解决方案。技术团队在研究中发现,市面多数评测工具仅支持英语环境且测试模式过于单一。

TRUEBench功能特点介绍

三星强调,TRUEBench创新性地实现了多语言支持和复杂对话场景的模拟评测。基于公司内部AI应用的实务经验,该工具重点评估AI在10大企业级场景中的表现,包括但不限于文档创作、数据解析、信息提炼及多语言转换等重要工作场景。

据悉,该评测系统包含2485组测试样本,覆盖12种语言环境和46个子类别的应用场景。测试内容从8字符的简单指令到20000余字符的复杂文档处理,全方位检验AI模型的实际应用能力。值得一提的是,TRUEBench采用"AI+人工"双评价机制,其测试数据集和评分榜单已在Hugging Face平台开放,用户可同时对5个AI模型进行横向比对。

三星电子DX部门CTO兼研究院院长Paul (Kyungwhoon) Cheun表示:"我们期望TRUEBench能够为行业树立生产力AI的评判标准。借助在真实应用场景中的技术沉淀,我们将持续巩固三星在AI领域的技术领导地位。"

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

印尼铜矿停产加剧供应紧张,资金抢筹铜行业资产

全球第二大铜矿突发停产事件,令本就紧张的国际铜市供给形势进一步恶化。美国矿业巨头自由港麦克莫兰公司位于印尼的铜矿因泥浆溃涌事故被迫暂停生产,初步评估显示,该事件导致公司第三季度铜和黄金销售指引分别下

2025-09-26.

阿里CEO吴泳铭:3年投3800亿加码AI基建

9 月 24 日消息,今日,杭州云栖小镇迎来了一年一度的云栖大会。在开幕式上,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表了主旨演讲,吴泳铭在演讲中表示,实现 AGI 已是确定

2025-09-26.

谷歌报告:90%工程师日常工作使用AI技术

9 月 24 日消息,据 CNN 23 日报道,谷歌最新研究显示,绝大多数科技行业员工在工作中使用 AI 来编写或修改代码等任务。该研究由谷歌 DORA 研究部门完成,基于全球 5000 名技术专

2025-09-26.

阿里Qwen3-Max模型发布:正式版性能业界领先

阿里巴巴在人工智能领域再推力作,正式发布旗下迄今为止规模最大、性能最强的语言模型Qwen3-Max。这款被业界视为技术突破的模型,不仅在基础架构上实现全面升级,更在多维度能力测试中展现出超越同类产品

2025-09-26.

物联网窨井液位监测系统保障城市排水安全

城市地下管网作为现代城市的“生命线”,其运行状态直接影响着城市安全。窨井作为管网系统的关键节点,液位异常不仅可能导致道路积水、设施损坏,甚至可能引发城市内涝等严重问题。传统的人工巡检方式效率低、实时

2025-09-26.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
玩偶战斗模拟器游戏
玩偶战斗模拟器游戏 休闲益智 2025-09-26更新
查看
时空旅梦人
时空旅梦人 动作冒险 2025-09-26更新
查看
西游伏魔记手游
西游伏魔记手游 角色扮演 2025-09-26更新
查看
黑洞大作战国际
黑洞大作战国际 休闲益智 2025-09-26更新
查看
少女养成日记
少女养成日记 休闲益智 2025-09-26更新
查看
台球世界九游
台球世界九游 体育竞技 2025-09-26更新
查看
山河旅探手游
山河旅探手游 动作冒险 2025-09-26更新
查看
天天打波利游戏
天天打波利游戏 休闲益智 2025-09-26更新
查看
非现实生活
非现实生活 角色扮演 2025-09-26更新
查看
进击要塞手游
进击要塞手游 棋牌策略 2025-09-26更新
查看