面包屑图标 当前位置: 首页
AI资讯
热点详情

北大与DeepSeek联合开源大模型正式发布

AI热点日报
AI热点日报时间:2026-06-30
热点解读

在当前大模型推理领域,最令人困扰的莫过于“效率瓶颈”问题。2025年6月28日,北京大学与深度求索联合推出了大模型推理加速框架DSpark,并将其正式开源。该框架专为解决大语言模型在高并发推理场景下,因频繁执行前向计算而导致的响应延迟与算力浪费问题而设计。在标准的自回归生成流程中,每输出一个词元,系

在当前大模型推理领域,最令人困扰的莫过于“效率瓶颈”问题。2025年6月28日,北京大学与深度求索联合推出了大模型推理加速框架DSpark,并将其正式开源。该框架专为解决大语言模型在高并发推理场景下,因频繁执行前向计算而导致的响应延迟与算力浪费问题而设计。

在标准的自回归生成流程中,每输出一个词元,系统都需要投入全部算力资源,这直接拖慢了对话的实时响应速度。尽管目前“推测解码”是主流的提速手段,但传统方案存在明显短板:简单模型串联生成耗时过长,而并行模型在处理长序列文本时,候选接受率容易下降,导致大量算力被白白浪费。

image.png

针对这些痛点,DSpark推出了双重优化机制。在候选生成阶段,它采用半自回归架构,通过并行主干网络一次性输出高质量的基础特征,再辅以轻量化模块优化文本逻辑。仅需两层Transformer结构,就能达到优于五层并行模型的表现,在速度与质量之间实现了巧妙的平衡。在验证调度层面,引入置信度调度验证机制,由硬件感知前缀调度器实时判断算力负载,优先处理可靠性高的文本片段,从而最大限度减少无效计算。

经过通义千问3、Gemma4等主流模型在代码编写、数学推理及日常对话等多项场景下的严格测试,DSpark表现十分亮眼。相比Eagle3和DFlash这两类行业主流基线模型,它在单轮有效生成长度上拥有显著优势,特别是在长序列生成任务中,有效缓解了候选有效率衰减的问题。

在工程化落地方面,研发团队进行了深度的系统级优化,包括采用序列打包降低内存消耗、设计异步调度模式消除GPU流水线卡顿,并确保对主流CUDA硬件生态的兼容。目前,DSpark已率先部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro预览版的服务引擎中。实测数据显示,无论响应速度标准如何设定,系统整体吞吐量均实现了跨越式增长。

值得一提的是,深度求索已全面开源了DSpark、DFlash及Eagle3的全套训练代码、模型权重及评估工具。这一举措将大幅降低行业高性能推理服务的部署成本,为大模型低成本普及提供了一套切实可行的技术范式。

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:北大与DeepSeek联合开源大模型正式发布要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://caip.org.cn/news/detail?id=47211
DeepSeek

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-06-30 17:31
京鱼座智能音箱开启用户未来智能新体验

智能音箱市场近期迎来一个值得关注的动态——京东智联云京鱼座正式与抖音展开合作。这次联动的直接成果,是京鱼座智能屏 i8 Pro 这款产品成功接入了抖音平台。由此诞生了这样的使用场景:当你吃着火锅、剥着龙虾,甚至正在洗澡时,只需喊一句“嗨小京鱼,打开抖音”,最新最热的短视频便会立刻呈现在屏幕上。与此同

AI热点2026-06-30 17:30
DeepSeek模型兼容性检测工具电脑配置达标测试

如今AI大模型层出不穷,尤其是DeepSeek系列,版本繁多让人无从下手。但一个核心问题始终绕不开:你的电脑配置能否支撑模型流畅运行?辛苦下载几十GB的模型,最终却因硬件不足卡顿或无法启动,实在令人沮丧。 核心信息很直观: DeepSeek模型备受关注,但硬件门槛不容小觑 thinkinai这一跨平

AI热点2026-06-30 17:30
企业级知识图谱增强检索生成RAG项目推荐

企业级知识图谱增强检索生成应用,正成为推动大语言模型在企业场景落地见效的关键突破口。一个值得重点关注的优秀开源方向是 Microsoft GraphRAG——它将企业内部散落在邮件、文档、日历、联系人中的海量数据,通过 Microsoft Graph 有机连接,构建成结构化的企业知识图谱,并以此强化

AI热点2026-06-30 17:30
支持Deepseek模型的AIOPS平台推荐

在运维领域摸爬滚打过的团队,大概都经历过这样的场景:告警风暴把值班群刷成了瀑布流,根因定位全靠人工翻日志,修复动作还得手写脚本。说实话,这事干久了,谁都想要一个能“自动思考”的运维助手。最近开源的 Keep 平台,就是奔着这个方向去的——它把 AI 塞进监控和告警流程里,试图让运维变得更聪明、更省心

延伸阅读