面包屑图标 当前位置: 首页
AI资讯
热点详情

端侧大模型新突破 Liquid AI开源混合专家模型LFM2.5

AI热点日报
AI热点日报时间:2026-05-30
热点解读

人工智能初创公司 Liquid AI 今天宣布了一项重要成果——正式发布并开源了全新的端侧大模型 LFM2 5-8B-A1B。该模型旨在显著提升消费级硬件上的工具调用能力与指令遵循表现,同时将计算成本控制在极低水平。最令人兴奋的是,它在端侧设备的推理性能上实现了肉眼可见的突破与提升。在架构设计方面,

人工智能初创公司 Liquid AI 今天宣布了一项重要成果——正式发布并开源了全新的端侧大模型 LFM2.5-8B-A1B。该模型旨在显著提升消费级硬件上的工具调用能力与指令遵循表现,同时将计算成本控制在极低水平。最令人兴奋的是,它在端侧设备的推理性能上实现了肉眼可见的突破与提升。

在架构设计方面,该模型采用了稀疏混合专家(MoE)架构,总参数量达 8.3B,但每次生成一个 Token 仅激活约 1.5B 参数。这意味着什么呢?意味着你的手机、笔记本电脑等消费级设备完全能够承载本地运行,无需依赖云端服务,本地推理速度飞快。

image.png

长文本处理能力与推理性能全面升级

相较于前代模型,LFM2.5 的上下文窗口从 32K 直接扩展到 128K 词元,预训练数据量也从 12T 跃升至 38T。作为一款专注于推理的模型,它在输出最终答案之前会先生成显式的思维链,并且具有较高的词表压缩效率,在处理中文、阿拉伯文等九种语言时效率更加出色。

在长推理场景中常见的逻辑死循环和幻觉问题如何解决?开发团队在训练过程中引入了两阶段强化学习(RL)。其中,偏好优化机制专门应对长链路推理中的循环问题,而防幻觉奖励机制则使模型在面对超出知识库范围的问题时,能够主动拒绝回答——这一点对于提升可靠性尤为关键。

端侧性能表现强劲 生态兼容性全面覆盖

在性能表现上,LFM2.5 实现了显著提升。逻辑推理与反幻觉基准测试的得分大幅超越前代模型,甚至在指令遵循能力上可与更大参数的模型相媲美。在工具调用方面,模型默认输出高效的 Python 函数,同时也支持通过系统提示词无缝切换为 JSON 格式。

发布首日便获得了主流推理框架的全面支持:llama.cpp、MLX、vLLM、SGLang 等全部兼容。硬件实测数据同样扎实——在 M5 Max 芯片上解码速度达到每秒 253 字节,在手机上也能达到约每秒 30 字节的解码速度。兼顾端侧运行的隐私保护与高效性能,这一模型表现令人印象深刻。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:端侧大模型新突破 Liquid AI开源混合专家模型LFM2.5要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://news.aibase.com/zh/news/28474
Liquid

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-05-30 08:57
大模型对齐技术综合评述:RLHF、RLAIF、PPO、DPO等(二)

3 1 强化学习从人类反馈中学习(RLHF) 如果说大模型对齐是一场让机器理解人类意图的修行,那么RLHF(Reinforcement Learning from Human Feedback)无疑是最早被证明有效的方法之一。它的思路很简单:既然模型自己难以判断什么是对的,那就让人类来当老师,用标注

AI热点2026-05-30 08:56
国产小钢炮MiniCPM3-4B:小参数蕴含大能量

AI 大模型领域里,参数规模似乎总在“军备竞赛”,但面壁智能的“小钢炮”系列却坚持另一条路线——用更小的体量,实现更强的性能。最新发布的 MiniCPM 3 0,仅 4B 参数,却宣称能在移动设备上跑出 GPT-3 5 级别的水平,并且集成了卓越的推理、检索和代码解释功能。这口气不小,我们来看看它究

AI热点2026-05-30 08:55
下一代开源知识库比Notion更强大

AFFiNE是一款融合Notion全能特性与Miro白板功能的开源知识库工具。它支持高度定制化页面布局、表格数据处理、实时多人协作编辑,并采用本地优先存储与端到端加密,可实现私有化部署,确保数据完全自主可控。

AI热点2026-05-30 08:54
OpenAI o1深度解析:揭秘草莓项目真相

OpenAI发布o1系列模型,通过强化学习使模型在回复前进行更长时间思考,模仿人类复杂推理过程。其在GPQADiamond、AIME数学竞赛和Codeforces编程竞赛中表现远超GPT-4o,推理能力达博士级水平,但非全方面碾压,且存在一定幻觉问题。

延伸阅读