当前位置: 首页
AI
5000亿美元巨头开源最强医疗AI 中国企业助力性能超越谷歌

5000亿美元巨头开源最强医疗AI 中国企业助力性能超越谷歌

热心网友 时间:2026-05-13
转载

一家估值超过5000亿美元的加密货币巨头,最近展示了一款在性能上足以挑战谷歌的AI医疗大模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

以发行全球最大稳定币USDT而闻名的Tether,近日推出了名为QVAC MedPsy的AI医疗大模型。多项医学推理与诊断基准测试的结果显示,其性能表现令人瞩目:

这款参数仅1.7B的轻量级模型,竟然击败了规模大16倍的谷歌MedGemma-27B。不仅如此,其4B参数版本在保持较高输出质量的同时,消耗的计算资源(token数)比主流模型少了3.2倍。

这一结果,直接对AI医疗领域长期信奉的“模型规模越大,效果越好”的共识提出了挑战。Tether AI团队在其技术说明中强调,该模型的设计理念更接近于一种“轻量级高密度推理系统”。

开发者社区对此反响积极,许多评论认为这种“低参数、高性能”的组合,或许为医疗大模型的发展指明了一条新的技术路径。

值得注意的是,Tether旗下的AI团队在2024年才启动招募,成立时间并不长。从其官网披露的技术细节和开源链路来看,QVAC MedPsy的训练并非完全从零开始,而是基于多个现有基础模型,进行了组合式的训练与深度优化。

中国大模型的持久统治力

深入追溯其背后的论文与技术报告,一个关键发现浮出水面:在封闭式医学基准测试以及HealthBench评估框架中,Tether团队实际上采用了一家中国公司的开源医疗大模型——百川智能的Baichuan-M3-235B——作为其核心的“教师模型”。

在Tether团队的内部模型筛选中,与Baichuan-M3同台竞技的对手包括OpenAI的GPT-OSS-120B,以及量化投资巨头旗下Ubiquant AI推出的Fleming-R1-32B。

结果显示,Baichuan-M3-235B在几乎所有核心评测指标上都占据了明显优势,尤其是在处理高复杂度医学问题时,其领先幅度更为显著。

其中,最值得关注的当属医学推理基准MedXpertQA。

这个基准被业内公认为难度最高的医学多选评测之一。与基于USMLE题库的传统MedQA不同,MedXpertQA更侧重于复杂的临床推理、多学科诊断以及长链路的决策能力,在某种程度上,它更贴近顶级医院多学科会诊(MDT)的真实场景。

在这一高难度基准上,Baichuan-M3相比其他竞品取得了高达10.98分的领先优势。对于医疗AI而言,这已不仅仅是简单的“精度提升”,它意味着模型在理解复杂病情、组织诊疗逻辑以及调用医学知识的能力上,可能已经产生了代际差异。

此外,在经典的大模型评测MMLU-Pro Health上,Baichuan-M3同样表现突出,分别取得了超过竞争对手5.05分和2.73分的优势。

事实上,早在2026年1月首次发布时,Baichuan-M3就已经在全球权威医疗AI评测基准HealthBench上击败了GPT-5.2,并刷新了当时的最高纪录。更难得的是,在AI模型更新迭代进入“月更时代”的背景下,它所建立的这种优势并未随时间迅速衰减。

具体数据显示,Baichuan-M3-235B相较GPT-OSS-120B领先约6至12分,相较Fleming-R1-32B领先约10至12分,并且在HealthBench的全部七个评估维度上都保持了持续性的优势。

Tether团队对Baichuan-M3模型的评价

这种持续领先的背后,是百川智能在医疗强化学习体系上长期投入的结果。

从2025年的M2模型开始,百川便将原本依赖患者模拟器与静态评分规则的半动态反馈机制,升级为能够随模型能力共同演化的全动态验证器系统。随着监督信号不断变得更为细化和困难,模型得以持续突破自身的能力上限,最终使得M3在复杂医学推理与医疗沟通能力上实现了质的飞跃。

与此同时,M3还首次具备了原生的“端到端”严肃问诊能力。这意味着它可以像真正的医生一样,在对话中主动追问、层层递进地逼近病因,将关键病史和风险信号一步步挖掘出来,然后再基于完整的信息进行深度的医学推理。

这也解释了为何Tether团队并非Baichuan-M系列模型唯一的拥趸。该系列模型在开源社区累计获得了超过150万次下载。得益于百川推出的「海纳百川」计划,M3 Plus API已向服务医务工作者的机构免费开放,目前已有大量团队基于该模型构建各类医疗应用。

甚至在今年3月OpenAI发布GPT-5.4之后,开源社区中仍有不少开发者呼吁,希望看到GPT系列与Baichuan-M3在HealthBench上进行一次正面对决,并质疑GPT在医疗健康领域的真实能力是否已被中国的医疗大模型反超。

正如百川智能创始人兼CEO王小川在媒体采访中所言:“(AI医疗的)护城河核心肯定在于模型能力的绝对领先,在医疗这一严肃领域,只有领先一代的技术水平才能建立行业信任。”

重构专业医疗的“数字基建”

当大模型浪潮席卷各行各业时,真正有能力且决心切入医疗AI核心领域的公司并不多,百川智能算是其中起步最早、路径最清晰的代表之一。

早在2023年成立后,百川智能便迅速跻身国内大模型赛道的前列。到了2025年,公司明确了“为人类造医生、为生命建模型”的核心战略,其后发布的模型几乎全部围绕医疗场景和推理能力增强展开。

同年10月,百川推出了首个循证增强医疗大模型Baichuan-M2Plus,其在控制“幻觉”(即事实性错误)方面的表现明显优于通用大模型,幻觉率降低至同期其他主流模型的三分之一,其回答的可信度已接近资深临床医生的水准。

年底,百川智能发布了医疗智能体平台PAPA。该平台能够实现从用药提醒到动态调整健康计划的全程管理,真正将AI能力嵌入到以月甚至年为周期的患者康复管理临床闭环之中。

随后登场的医疗大模型Baichuan-M3更是取得了突破性进展。它在全球权威医疗评测HealthBench中以65.1分的成绩登顶,首次全面超越GPT-5.2,并同时刷新了医疗幻觉率的最低记录。

进入2026年,医疗健康已成为AI技术最受重视的落地领域之一。OpenAI推出了“个人超级健康助手”ChatGPT Health,谷歌发布了最新的开源医疗模型MedGemma 1.5,Anthropic也拿出了Claude for Healthcare来抢占医疗市场。

与通用大模型“先做能力、再找场景”的常见路径不同,百川智能选择深耕医疗垂直领域,紧紧围绕临床真实需求打磨产品,持续在低幻觉率、端到端问诊和复杂临床推理等核心能力上寻求突破。

例如,其构建的“深度问诊”能力,让模型能够在有限的对话轮次中,将临床诊断所需的关键问题问全、问准,其表现甚至显著超过了设定的人类医生基线水平。

而首创的“证据锚定”技术,不仅为模型的医学结论提供引文来源,更能将每一句结论精确映射到原始医学论文的对应段落。这使得AI的医学判断变得可核验、可追责、可教学,极大地增强了其在临床环境中的可信度。

正是这些扎实的技术积累,让百川智能在医疗AI行业进入深水区后,逐渐形成了独特的差异化优势——不仅拥有强大的底层模型能力,更对医院的工作流程有深刻理解,其产品也更贴近真实的临床场景。

在政策支持、医院数智化转型与大模型技术突破的多重动力推动下,医疗AI正在步入真正的产业化周期。而已经提前完成垂直领域深耕、初步建立起技术与场景闭环的百川智能,显然占据了更为有利的竞争位置。

据行业信息显示,百川智能即将发布新的AI医疗应用产品与新一代大模型,其实际应用表现与后续技术成果,值得保持高度关注。

来源:https://www.aitntnews.com/newDetail.html?newId=25026

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
2025年8月创新科技基金资助计划整合与申请流程简化指南

2025年8月创新科技基金资助计划整合与申请流程简化指南

创新科技基金(ITF)的资助体系即将迎来重大优化升级。根据官方最新通告,旗下多项资助计划的简化与整合工作现已全面完成,相关调整方案将于2025年8月1日起正式实施。对于有意申请研发资助或推动产业升级的企业而言,及时掌握新规细则,对于提前布局和优化申请策略至关重要。 新工业化支援计划全面整合 本次变革

时间:2026-05-13 16:15
美国电动卡车充电站建设现状与未来规划详解

美国电动卡车充电站建设现状与未来规划详解

CALSTART近期发布了升级版美国中重型零排放卡车基础设施地图,为运输行业提供了一份更精准、更实用的充电与加氢站导航指南。 这份“全国中重型零排放基础设施地图”现已收录美国17个州约162个站点,全面兼容电动卡车与氢燃料电池卡车。此次更新恰逢CALSTART发布《零排放卡车聚焦报告》,报告指出,面

时间:2026-05-13 16:14
英伟达Vera Rubin芯片提前至7月发布

英伟达Vera Rubin芯片提前至7月发布

2026年5月,英伟达(NVIDIA)宣布了一项颠覆行业惯例的重大决策:将下一代旗舰AI计算平台Vera Rubin的发布时间,从原计划的2027年初大幅提前至2026年7月,整整提前了7个月。供应链消息迅速跟进确认,该平台的流片试产(tape-out)将于6月启动,首批产品在7月便会直接交付给微软

时间:2026-05-13 16:07
V2G技术应用:电动车如何成为电网的移动储能单元

V2G技术应用:电动车如何成为电网的移动储能单元

在本期《快速充电》深度访谈中,我们对话了移动之家北美区市场传播总监迪伦·盖斯佩里克。探讨聚焦于ACT展会前沿动态、V2G技术与起亚汽车的整合路径、与公用事业公司的合作项目,并深入解析了一个核心议题:电动汽车如何从潜在的电网负担,转变为增强电网稳定与韧性的战略性资产。 近期,移动之家与Wallbox合

时间:2026-05-13 16:06
创通新科发布AI智算战略布局未来计算新蓝图

创通新科发布AI智算战略布局未来计算新蓝图

近日,创通新科(深圳)集团正式发布其AI智算战略规划,并同步推出两大核心产品矩阵——CTONE Agent Computer(智能体计算设备)与CTONE AI Agent Workstation(AI全栈工作站垂直领域解决方案)。这两条产品线全面覆盖了从智能办公到企业级私有化部署的全场景AI计算需

时间:2026-05-13 16:06
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程