当前位置: 首页
AI
蚂蚁百灵开源医疗推理数据集 加速大模型行业应用

蚂蚁百灵开源医疗推理数据集 加速大模型行业应用

热心网友 时间:2026-05-16
转载

12月28日,在上海举办的“虹桥之源”大模型驱动数字经济新生态峰会上,一项聚焦医疗AI领域的重要进展正式公布。蚂蚁集团商业机器智能部总经理顾进杰在会上宣布,正式开源国内首个面向医疗专科的推理数据集。此举旨在精准提升大模型在垂直医疗场景下的专业诊断与逻辑推理能力,为行业提供关键数据基础设施。

蚂蚁集团商业机器智能部总经理顾进杰在会上介绍国内首个医疗专科推理数据集

当前,通用大模型在处理医疗问诊任务时,普遍存在一个显著差异:模型往往倾向于直接输出结论,而真实的临床诊断过程,则是医生基于专业知识进行多轮询问、鉴别与严谨推理的闭环。此外,大模型固有的“幻觉”问题、推理能力不足,以及高质量中文医学专科数据的匮乏,共同构成了训练可靠医疗领域大模型的现实挑战。

为应对这些核心难题,蚂蚁集团与上海仁济医院泌尿科顶尖专家团队展开深度合作。双方紧密结合一线临床经验,通过构建高度仿真的模拟病例数据,共同推出了首个中文医疗专科问答推理数据集——RJUA-QA。这也是业界首个真正基于临床专科实践构建的数据集。

该数据集由训练集、验证集和测试集三部分组成,共包含2132个高质量问答对。每个问答对均源于医生的真实临床经验,完整涵盖患者问题、专家级回答以及支撑推理的关键上下文信息。其病种覆盖范围超过97.6%的泌尿科常见就诊人群,能够高度还原真实诊疗场景。该数据集不仅可用于增强大模型的诊断推理能力,更能作为一个严谨、可控的评测基准,为医疗AI产品的落地与优化提供一把可靠的“标尺”。

借此机会,顾进杰进一步分享了蚂蚁百灵大模型在医疗赛道上的核心技术布局。他认为,专业性、可控性、轻量化是推动大模型与医疗行业深度融合必须跨越的三大核心挑战,同时也孕育着巨大的市场机遇。

专业性:构建多模态知识引擎,开源专科数据集

医疗行业细分领域众多,超百个临床科室各有其独立的知识体系。要让大模型真正“精通专科”,必须在每个垂直领域进行深度优化与调试。为此,蚂蚁集团联合医疗专家研发了多模态医疗知识引擎,并持续推动如RJUA-QA这类专业数据集的构建与开源,为行业提供高质量的基础“数据燃料”。

可控性:知识图谱深度赋能,确保回答“有源可溯”

如何确保大模型输出的内容可靠、可追溯?百灵大模型的核心策略是深度融合知识图谱技术。这使得模型的每一个回答背后都有一条清晰、可验证的知识依据链条。顾进杰指出,生成内容能够灵活适配不同医院、不同科室的定制化需求,包括表述风格与专业调性。蚂蚁在超大规模图学习与知识图谱领域拥有长期技术积累,其联合OpenKG发布的开源项目OpenSPG,重新定义了工业级知识图谱的语义架构。知识检索增强技术正是大幅提升大模型答案准确性、可靠性与可控性的关键所在。

轻量化:实现“小身材大能量”,赋能高效部署

考虑到医疗机构对数据隐私、专业自主性的严格要求,以及实际的算力成本与部署便捷性需求,模型的轻量化至关重要。蚂蚁集团于12月开源的模型轻量化框架(PIA),集成了模型剪枝、压缩、量化、推理加速等全链路优化技术,具备开箱即用、功能无损、低代码接入等特性。据悉,该框架可在数天内完成10倍以上的模型压缩,让“大模型”也能变得小巧、高效且易于集成。

那么,这些技术投入的实际效果如何?从多项公开评测来看,蚂蚁百灵大模型的表现颇具竞争力。目前,其在中英文医学考试及多项权威基准测试中,已达到或超越了GPT-4的水平。例如,在中文医疗大模型权威评测榜单PromptCBLUE上,取得了A榜第一、B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率跻身全球前五,并且是前十名中参数量最小的模型——这意味着它在保持高精度诊断能力的同时,具备了更优的易用性与部署性价比,更贴合医疗机构的实际应用需求。

来源:https://www.leiphone.com/category/ai/ngdVFtbpP9nhNX8O.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
趋境科技携手金航数码深化AI合作,共促空天领域数字化转型

趋境科技携手金航数码深化AI合作,共促空天领域数字化转型

趋境科技与金航数码签署人工智能合作框架协议,将前期成功实践深化为战略伙伴关系。双方基于已验证的大模型私有化解决方案,聚焦航空等复杂装备工业,通过算力底座与行业场景深度融合,共同推动智能化技术在研发、生产等环节的落地应用,助力工业数字化转型升级。

时间:2026-05-16 08:30
城市智能最后一公里难题的论文解决方案

城市智能最后一公里难题的论文解决方案

郑宇教授提出跨域多模态知识融合框架,整合空气质量、交通、气象等多领域数据,通过数据选择、知识对齐、模型构建与数据转换四个阶段,解决了数据稀疏与异构难题,显著提升了预测精度与异常识别能力,为智慧城市应用提供了可行路径。

时间:2026-05-16 08:30
ATEC2025科技精英赛落幕 机器人自主技术成焦点

ATEC2025科技精英赛落幕 机器人自主技术成焦点

第五届ATEC科技精英赛在香港收官,赛事以“无遥操”为核心,要求机器人在户外复杂地形中完全自主完成吊桥穿越、垃圾分拣等任务。来自全球的13支队伍参赛,浙江大学凭借全自主智能表现夺冠。比赛旨在推动机器人从实验室走向真实应用,通过真实场景挑战测试机器人的感知、决策与执行能力,促。

时间:2026-05-16 08:30
Recraft AI设计草稿如何保存与云端同步方法

Recraft AI设计草稿如何保存与云端同步方法

RecraftAI采用自动云端同步实时保存设计草稿,无需手动操作。用户可通过项目列表中“Lastedited”时间戳的实时更新验证同步状态,并需保持网络稳定与登录有效。必要时可刷新页面或进行微小操作触发同步。跨设备核对内容一致性是确认草稿安全存储于云端的最终方法。

时间:2026-05-16 08:30
花旗上调思科目标价至112美元 最新评级分析

花旗上调思科目标价至112美元 最新评级分析

花旗银行将思科目标股价从90美元上调至112美元,反映出机构对其基本面或行业前景的重新评估。市场关注点可能集中于企业网络支出、云计算进展及人工智能需求。股价走势还需综合财报、经济环境等因素判断,未来业绩指引是验证预期的关键。

时间:2026-05-16 08:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程