面包屑图标 当前位置: 首页
AI资讯
热点详情

北大与DeepSeek联合开源大模型推理框架DSpark 算力提速关键突破

AI热点日报
AI热点日报时间:2026-06-29
热点解读

大模型推理效率的瓶颈,如今终于迎来了技术层面的突破。2025年6月28日,北京大学携手深度求索联合发布并开源了大模型推理加速框架——DSpark,其核心目标十分明确:解决大语言模型在高并发场景下,因频繁前向计算所导致的响应延迟与算力浪费问题。先来看一个关键痛点。在大模型标准的自回归生成流程中,每次输

大模型推理效率的瓶颈,如今终于迎来了技术层面的突破。2025年6月28日,北京大学携手深度求索联合发布并开源了大模型推理加速框架——DSpark,其核心目标十分明确:解决大语言模型在高并发场景下,因频繁前向计算所导致的响应延迟与算力浪费问题。

先来看一个关键痛点。在大模型标准的自回归生成流程中,每次输出一个词元,系统都需要消耗完整的算力资源。这一点直接制约了对话的实时响应速度——你说一句话,模型不得不逐字“思考”,每一步都是满负荷运算。尽管推测解码是目前主流的提速手段,但传统方案存在明显短板:简单模型串行生成耗时过长,而并行模型在处理长序列时,候选接受率容易下降,从而导致大量算力被白白浪费。

image.png

针对这些不足,DSpark引入了双重优化机制。在候选生成阶段,它采用半自回归架构——通过并行主干网络一次性输出高质量的基础特征,再借助轻量化模块来优化文本逻辑。这套方案有多高效?仅需两层Transformer结构,就能取得优于五层并行模型的表现,在速度与质量之间找到了一个巧妙的平衡点。在验证调度层面,框架内置了置信度调度验证机制:由硬件感知前缀调度器实时判断算力负载,优先处理可靠性高的文本片段,从而最大程度减少无效计算。

实际表现如何?在通义千问3、Gemma4等主流模型上,经过代码编写、数学推理、日常对话等多场景的严格测试,DSpark的成果相当亮眼。对比Eagle3和DFlash这两类行业主流基线模型,它的单轮有效生成长度优势明显;尤其在长序列生成任务中,有效缓解了候选有效率衰减这一长期存在的难题。

工程落地方面,研发团队做了深度系统级优化。包括采用序列打包来降低内存消耗、设计异步调度模式消除GPU流水线卡顿,同时对主流CUDA硬件生态进行了兼容性保障。目前,DSpark已经率先部署在DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中。实测数据表明,无论采用哪种响应速度标准,系统整体吞吐量都实现了跨越式增长。

值得关注的是,深度求索已在GitHub项目中开源了DSpark、DFlash及Eagle3的全套训练代码、模型权重及评估工具。这意味着,行业高性能推理服务的部署成本将大幅降低,为大模型的低成本普及提供了一条切实可行的技术路径。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:北大与DeepSeek联合开源大模型推理框架DSpark 算力提速关键突破要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://news.aibase.com/zh/news/29212
DeepSeek

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-07-01 21:45
KwalAI Chrome插件 专业高效实用AI智能浏览器在线助手工具

在招聘这个行业中,数据录入的繁琐程度相信大家都有切身体会。每天需要从各类网页、社交平台、招聘站点中搜寻候选人信息,再手动一条条录入系统,既耗时费力又容易出错。今天要介绍的这款Kwal Chrome插件,正是为了彻底解决这一痛点而设计的。什么是 Kwal Chrome 扩展程序 插件?该插件的定位十分

AI热点2026-07-01 21:45
Twinning AI创建AI克隆与粉丝聊天获利

网红经济正在进化——Twinning AI带来的玩法是:粉丝可以直接跟你的人工智能分身聊天,而你,每次互动都能收到真金白银。它集成了专业的声音克隆、文本和语音消息,以及数据分析能力,让粉丝互动变得既有趣又能变&现。 什么是Twinning AI? 简单来说,Twinning AI允许网红创建一个属于

AI热点2026-07-01 21:45
Invoicemint人工智能发票与财务管理软件

在跨境电商和全球业务快速发展的今天,发票与财务管理工具的重要性日益凸显。AI技术的加入,让这些原本繁琐的流程实现了质的飞跃。Invoicemint 正是这样一款专注全球企业的智能发票与财务管理软件——它不只是一个简单的发票生成器,而是一套覆盖从开票、对账到税务合规、催款的全链路解决方案。 什么是In

AI热点2026-07-01 21:45
MyWhy实时AI语音心理治疗师

想象一下,你随时都能找到一个倾听者——不带任何偏见,不会感到疲惫,而且完全匿名。这听起来像科幻小说里的情节,但现在已经成为现实。MyWhy 就是这样一款 AI 心理治疗应用,它将专业的情感支持装进你的口袋,让心理健康服务不再是奢侈品,而是像打开手机一样触手可及。什么是MyWhy?简单来说,MyWhy

延伸阅读