5000亿美元巨头开源最强医疗AI 中国企业助力性能超越谷歌
一家估值超过5000亿美元的加密货币巨头,最近展示了一款在性能上足以挑战谷歌的AI医疗大模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
以发行全球最大稳定币USDT而闻名的Tether,近日推出了名为QVAC MedPsy的AI医疗大模型。多项医学推理与诊断基准测试的结果显示,其性能表现令人瞩目:
这款参数仅1.7B的轻量级模型,竟然击败了规模大16倍的谷歌MedGemma-27B。不仅如此,其4B参数版本在保持较高输出质量的同时,消耗的计算资源(token数)比主流模型少了3.2倍。
这一结果,直接对AI医疗领域长期信奉的“模型规模越大,效果越好”的共识提出了挑战。Tether AI团队在其技术说明中强调,该模型的设计理念更接近于一种“轻量级高密度推理系统”。

开发者社区对此反响积极,许多评论认为这种“低参数、高性能”的组合,或许为医疗大模型的发展指明了一条新的技术路径。
值得注意的是,Tether旗下的AI团队在2024年才启动招募,成立时间并不长。从其官网披露的技术细节和开源链路来看,QVAC MedPsy的训练并非完全从零开始,而是基于多个现有基础模型,进行了组合式的训练与深度优化。

中国大模型的持久统治力
深入追溯其背后的论文与技术报告,一个关键发现浮出水面:在封闭式医学基准测试以及HealthBench评估框架中,Tether团队实际上采用了一家中国公司的开源医疗大模型——百川智能的Baichuan-M3-235B——作为其核心的“教师模型”。
在Tether团队的内部模型筛选中,与Baichuan-M3同台竞技的对手包括OpenAI的GPT-OSS-120B,以及量化投资巨头旗下Ubiquant AI推出的Fleming-R1-32B。
结果显示,Baichuan-M3-235B在几乎所有核心评测指标上都占据了明显优势,尤其是在处理高复杂度医学问题时,其领先幅度更为显著。
其中,最值得关注的当属医学推理基准MedXpertQA。
这个基准被业内公认为难度最高的医学多选评测之一。与基于USMLE题库的传统MedQA不同,MedXpertQA更侧重于复杂的临床推理、多学科诊断以及长链路的决策能力,在某种程度上,它更贴近顶级医院多学科会诊(MDT)的真实场景。
在这一高难度基准上,Baichuan-M3相比其他竞品取得了高达10.98分的领先优势。对于医疗AI而言,这已不仅仅是简单的“精度提升”,它意味着模型在理解复杂病情、组织诊疗逻辑以及调用医学知识的能力上,可能已经产生了代际差异。
此外,在经典的大模型评测MMLU-Pro Health上,Baichuan-M3同样表现突出,分别取得了超过竞争对手5.05分和2.73分的优势。
事实上,早在2026年1月首次发布时,Baichuan-M3就已经在全球权威医疗AI评测基准HealthBench上击败了GPT-5.2,并刷新了当时的最高纪录。更难得的是,在AI模型更新迭代进入“月更时代”的背景下,它所建立的这种优势并未随时间迅速衰减。
具体数据显示,Baichuan-M3-235B相较GPT-OSS-120B领先约6至12分,相较Fleming-R1-32B领先约10至12分,并且在HealthBench的全部七个评估维度上都保持了持续性的优势。

Tether团队对Baichuan-M3模型的评价
这种持续领先的背后,是百川智能在医疗强化学习体系上长期投入的结果。
从2025年的M2模型开始,百川便将原本依赖患者模拟器与静态评分规则的半动态反馈机制,升级为能够随模型能力共同演化的全动态验证器系统。随着监督信号不断变得更为细化和困难,模型得以持续突破自身的能力上限,最终使得M3在复杂医学推理与医疗沟通能力上实现了质的飞跃。
与此同时,M3还首次具备了原生的“端到端”严肃问诊能力。这意味着它可以像真正的医生一样,在对话中主动追问、层层递进地逼近病因,将关键病史和风险信号一步步挖掘出来,然后再基于完整的信息进行深度的医学推理。
这也解释了为何Tether团队并非Baichuan-M系列模型唯一的拥趸。该系列模型在开源社区累计获得了超过150万次下载。得益于百川推出的「海纳百川」计划,M3 Plus API已向服务医务工作者的机构免费开放,目前已有大量团队基于该模型构建各类医疗应用。
甚至在今年3月OpenAI发布GPT-5.4之后,开源社区中仍有不少开发者呼吁,希望看到GPT系列与Baichuan-M3在HealthBench上进行一次正面对决,并质疑GPT在医疗健康领域的真实能力是否已被中国的医疗大模型反超。

正如百川智能创始人兼CEO王小川在媒体采访中所言:“(AI医疗的)护城河核心肯定在于模型能力的绝对领先,在医疗这一严肃领域,只有领先一代的技术水平才能建立行业信任。”
重构专业医疗的“数字基建”
当大模型浪潮席卷各行各业时,真正有能力且决心切入医疗AI核心领域的公司并不多,百川智能算是其中起步最早、路径最清晰的代表之一。
早在2023年成立后,百川智能便迅速跻身国内大模型赛道的前列。到了2025年,公司明确了“为人类造医生、为生命建模型”的核心战略,其后发布的模型几乎全部围绕医疗场景和推理能力增强展开。
同年10月,百川推出了首个循证增强医疗大模型Baichuan-M2Plus,其在控制“幻觉”(即事实性错误)方面的表现明显优于通用大模型,幻觉率降低至同期其他主流模型的三分之一,其回答的可信度已接近资深临床医生的水准。
年底,百川智能发布了医疗智能体平台PAPA。该平台能够实现从用药提醒到动态调整健康计划的全程管理,真正将AI能力嵌入到以月甚至年为周期的患者康复管理临床闭环之中。
随后登场的医疗大模型Baichuan-M3更是取得了突破性进展。它在全球权威医疗评测HealthBench中以65.1分的成绩登顶,首次全面超越GPT-5.2,并同时刷新了医疗幻觉率的最低记录。
进入2026年,医疗健康已成为AI技术最受重视的落地领域之一。OpenAI推出了“个人超级健康助手”ChatGPT Health,谷歌发布了最新的开源医疗模型MedGemma 1.5,Anthropic也拿出了Claude for Healthcare来抢占医疗市场。
与通用大模型“先做能力、再找场景”的常见路径不同,百川智能选择深耕医疗垂直领域,紧紧围绕临床真实需求打磨产品,持续在低幻觉率、端到端问诊和复杂临床推理等核心能力上寻求突破。
例如,其构建的“深度问诊”能力,让模型能够在有限的对话轮次中,将临床诊断所需的关键问题问全、问准,其表现甚至显著超过了设定的人类医生基线水平。
而首创的“证据锚定”技术,不仅为模型的医学结论提供引文来源,更能将每一句结论精确映射到原始医学论文的对应段落。这使得AI的医学判断变得可核验、可追责、可教学,极大地增强了其在临床环境中的可信度。
正是这些扎实的技术积累,让百川智能在医疗AI行业进入深水区后,逐渐形成了独特的差异化优势——不仅拥有强大的底层模型能力,更对医院的工作流程有深刻理解,其产品也更贴近真实的临床场景。
在政策支持、医院数智化转型与大模型技术突破的多重动力推动下,医疗AI正在步入真正的产业化周期。而已经提前完成垂直领域深耕、初步建立起技术与场景闭环的百川智能,显然占据了更为有利的竞争位置。
据行业信息显示,百川智能即将发布新的AI医疗应用产品与新一代大模型,其实际应用表现与后续技术成果,值得保持高度关注。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
2025年8月创新科技基金资助计划整合与申请流程简化指南
创新科技基金(ITF)的资助体系即将迎来重大优化升级。根据官方最新通告,旗下多项资助计划的简化与整合工作现已全面完成,相关调整方案将于2025年8月1日起正式实施。对于有意申请研发资助或推动产业升级的企业而言,及时掌握新规细则,对于提前布局和优化申请策略至关重要。 新工业化支援计划全面整合 本次变革
美国电动卡车充电站建设现状与未来规划详解
CALSTART近期发布了升级版美国中重型零排放卡车基础设施地图,为运输行业提供了一份更精准、更实用的充电与加氢站导航指南。 这份“全国中重型零排放基础设施地图”现已收录美国17个州约162个站点,全面兼容电动卡车与氢燃料电池卡车。此次更新恰逢CALSTART发布《零排放卡车聚焦报告》,报告指出,面
英伟达Vera Rubin芯片提前至7月发布
2026年5月,英伟达(NVIDIA)宣布了一项颠覆行业惯例的重大决策:将下一代旗舰AI计算平台Vera Rubin的发布时间,从原计划的2027年初大幅提前至2026年7月,整整提前了7个月。供应链消息迅速跟进确认,该平台的流片试产(tape-out)将于6月启动,首批产品在7月便会直接交付给微软
V2G技术应用:电动车如何成为电网的移动储能单元
在本期《快速充电》深度访谈中,我们对话了移动之家北美区市场传播总监迪伦·盖斯佩里克。探讨聚焦于ACT展会前沿动态、V2G技术与起亚汽车的整合路径、与公用事业公司的合作项目,并深入解析了一个核心议题:电动汽车如何从潜在的电网负担,转变为增强电网稳定与韧性的战略性资产。 近期,移动之家与Wallbox合
创通新科发布AI智算战略布局未来计算新蓝图
近日,创通新科(深圳)集团正式发布其AI智算战略规划,并同步推出两大核心产品矩阵——CTONE Agent Computer(智能体计算设备)与CTONE AI Agent Workstation(AI全栈工作站垂直领域解决方案)。这两条产品线全面覆盖了从智能办公到企业级私有化部署的全场景AI计算需
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

