蚂蚁数科发布金融推理大模型,如何突围百模大战?

金融行业又迎来了一个新的大模型。
7月底举行的2025世界人工智能大会(WAIC)论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,提供32B和8B两个版本,为金融AI应用打造可靠可优化智能中枢。
该模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越同尺寸开源通用大模型以及金融大模型,显示其更强的金融专业性、推理能力以及安全合规能力。
实际上,随着大模型从技术走向应用落地,金融行业的实际业务场景中,往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,然而,现有的基础大模型“幻觉率”依然很高,在解决实际金融任务时仍然存在诸多挑战,因此,“百模大战”下,金融这一专业领域也需要更懂金融的专业大模型。
蚂蚁数科CEO赵闻飙表示,通用大模型距离产业实际应用存在“知识鸿沟”。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。
基础大模型无法适应金融专业场景
研究机构IDC于近日发布的一份报告显示,2024年,中国金融行业生成式 AI平台及应用解决方案市场总规模约为9.14亿元人民币,约占整体AI平台及应用市场规模的14%。
由于金融行业的特殊性,往往对于数据安全性、隐私保护以及监管合规等要求高于其他行业。大多数金融机构会选择本地化部署方式落地生成式AI平台及生成式AI应用。数据显示,2024年,中国金融行业生成式 AI 平台及应用解决方案市场规模中本地化部署方式的规模约占总规模的91%。
而且,保险、消金/互金、券商等金融机构在合同审核、智能客服、知识助手等场景仍会以MaaS(MaaS)模式接入大模型,以此提供以云服务模式交付的全流程大模型生命周期工具链以及大模型服务。
WAIC一场论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示,大模型的专业化应用,首要的是可靠性问题。尽管当前技术SOTA(指行业顶尖水平)已经达到了80%到90%的水平,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。
蚂蚁数科CTO王维也表示,金融行业用好AI技术还是面临很多的挑战,包括大模型在金融场景中的“幻觉”、差错或者回答没有达到金融企业要求,“如何把通用能力和场景鸿沟弥合。从水平通用大模型向专业/专用模型演进,这也是数科持续攻坚的方向。”
事实上,蚂蚁数科此次发布的金融推理大模型Agentar-Fin-R1,就是专门面向金融任务设计,通过构建全面的金融任务数据体系以及模型训练算法创新,实现模型更强的金融推理能力及可信性。
在数据层面,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景,基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力;
训练层面,蚂蚁创新的加权训练算法,最大化提升数据利用效率及训练效率,同时通过动态分配训练资源,提高大模型对复杂金融任务学习效率与性能,在后续业务应用中,可以显著减少二次微调的数据需求与算力消耗,降低大模型落地企业的门槛和成本。
此外,Agentar-Fin-R1不断更新迭代,吸收最新的金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化,确保知识、能力和合规性始终紧跟行业变化,让模型能力在真实业务场景中不断进化。
评测结果显示,在业内主流的大模型金融评估基准FinEval 1.0、FinancelQ等评测中,Agentar-Fin-R1均取得最高评分,超过DeepSeek、Qwen等开源通用模型以及xuanyuan等金融大模型,并且Agentar-Fin-R1在金融能力显著增强的同时,通用能力也表现出较高水准。
为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。
在Finova评测中,Agentar-Fin-R1也取得最高评分,甚至超越DeepSeek-R1、GPT-o1等更大参数规模的通用模型。目前Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。
据悉,Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MoE(混合专家)架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。
“一个推理能力很强的垂直大模型,才能成为智能体可控、可靠、可优化的智能中枢。齿轮决定了机器、履带要严丝合缝,没有关键性的齿轮,那其他的齿轮就带不动。而推理模型产生出来的推理能力、泛化和意图识别能力,可以让企业更加有意愿升级原有的业务模式,否则就很难谈增量价值的创造了。”王维称。
“AI+金融”进入深水区,2027年国内规模将超35亿元
IDC预计,到2027年,中国金融行业生成式 AI 平台及应用解决方案市场规模将攀升至35.09亿元,较2024年实现384%的增幅。
IDC中国金融行业研究总监高飞表示,随着大模型相关技术的快速迭代,生成式AI在金融行业的实践正在经历从“局部工具”向“企业级平台能力”的升级。其应用场景也在由单一的效率提升,逐步拓展至业务决策的支持与任务执行。
“一个不能理解行业的大模型,它难以产生真正的价值。”王维表示,蚂蚁数科希望帮助金融行业客户解决大模型在核心业务场景落地的问题,让大模型真正深入实际应用场景,创造真实价值。
在王维看来,蚂蚁数科的优势,一方面在于背靠蚂蚁集团的底层技术能力,另一方面来自于长期深耕金融场景所积累的金融know-how能力。
今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。
其中,在金融领域,蚂蚁数科此前推出金融智能体平台Agentar,贯通智算调度、数据与模型平台、行业大模型及应用落地全流程,助力金融机构高效搭建专业智能体应用,加速大模型在金融行业的落地应用。
今年7月,蚂蚁数科还宣布联合金融业伙伴进行创新,推出超过100个金融场景智能体解决方案,覆盖银行、证券、保险、通用等四大领域。包括零售业务助手、AI原生手机银行、智能营销和风控等多个已经在金融实际场景中深度应用的智能体解决方案。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
亚马逊与沃尔玛的GenAI战略差异:两种零售巨头如何布局人工智能
如果未来的购物不再从“搜索”开始,而是从一段与AI的对话开始——零售的控制权,会被谁拿走?这是所有电商零售平台都需要直面的问题。你会看到两位主角的反应截然不同:7月,亚马逊阻止了包括Google S
印度软件外包行业面临AI转型挑战
四十年前,班加罗尔的小办公室里,Infosys创始人用250美元启动资金创造了数百万个中产阶级岗位,让印度工程师一度成为全球IT外包不可或缺的关键词。据悉,鼎盛时期,美国GDP每增长1%,印度IT出
AI时代如何学编程?对话谷歌科学家谈未来教育方向
“编程已死?”面对 AI 工具能自动生成代码的浪潮,谷歌科学家斯蒂芬妮·德鲁加(Stefania Druga)回答说:“不,学习编程的作用远未失效。”超越工具属性:编程的核心价值在思维塑造在近期Ed
睿尔曼郑随兵:具身智能规模化应用面临人才挑战
人形机器人数据训练中心运营方负责人、睿尔曼公司创始人兼CEO郑随兵随着机器人逐步从实验室走向生活与生产,数据采集和训练有望成为新的技术壁垒。8月15日首钢园举行的石景山人形机器人数据训练中心开放日活
人工智能与互联网:技术演进中的碰撞与融合
关于AI将如何重塑世界,当下的讨论充满了喧嚣与迷雾。有人在渲染通用人工智能(AGI)的奇点焦虑,有人在计算AI取代了多少岗位,但这些讨论往往忽略了一个更根本、更迫在眉睫的关键:AI如果充分代表个人意
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















