面包屑图标 当前位置: 首页
AI资讯
热点详情

沐曦龙蜥SGLang技术MeetUp北京举办亮点抢先看

AI热点日报
AI热点日报时间:2026-06-07
热点解读

沐曦、龙蜥与SGLang社区联合举办技术MeetUp,聚焦SGLang开源生态、国产GPU深度适配、Mooncake推理架构及AI性能分析工具等议题,通过技术分享与圆桌对话探讨国产算力与开源系统的协同演进。活动涵盖SGLang路线图、全链路可观测性、多智能体推理优化及企业级落地实践。

当高性能推理引擎遇上国产算力,技术落地的边界究竟能拓展多远?这个周六(6月6日),北京·融科资讯中心即将迎来一场硬核技术聚会——由沐曦股份、龙蜥社区、SGLang社区等生态伙伴联合推出的“沐‘蜥’芯生,开源共创——SGLang技术交流Meetup”。活动聚焦SGLang开源生态、国产GPU深度适配、Mooncake推理架构、AI性能分析工具等前沿议题,通过技术分享和圆桌对话,真正把国产算力与开源系统的协同演进推到台前。

当然,干货之外,龙蜥社区也为参会者准备了实用四件套、定制双包、环保帆布袋和精美本笔套装。期待大家带着前沿技术碰撞的火花,满载社区的心意而归。

本次MeetUp的演讲亮点抢先看——

1、演讲主题:SGLang Roadmap:面向大模型与多模态模型的高性能开源推理系统
嘉宾:童心源,SGLang Core Maintainer
简介:SGLang作为面向大语言模型与多模态模型的高性能开源推理框架,支持从单卡到大规模分布式集群的低延迟、高吞吐部署。这次分享将带来最新进展和未来发展路线图,涉及高效运行时、模型与硬件支持、工业界应用、开源社区协作,以及它在RL/post-training rollout后端中的实践。一句话概括:看看SGLang如何撑起下一代开放、可扩展的大模型服务生态。

2、演讲主题:从全链路可观测到智能分析:AI性能分析范式的演进与实践
嘉宾:苏峰,龙蜥社区SGLang项目开发者;常怀鑫,龙蜥社区智算联盟委员
简介:AI Agent加速落地的背景下,性能分析正在从“人工专家驱动”转向“Agent自主智能”。过去靠SGLang Tracing深入Runtime底层,可视化追踪精准捕获调度、KV Cache及GPU执行指标,让推理黑盒透明化。现在结合Agent与LLM,不仅能延续底层指标的洞察,还能自动瓶颈定位和根因分析。本分享将回顾SGLang可观测性建设历程,并探讨如何用新一代AI技术重构性能分析工作流——为构建高效稳定的AI服务保驾护航。

3、演讲主题:记忆感知驱动——基于Mooncake的多智能体推理架构优化
嘉宾:马腾,阿里云高级技术专家
简介:核心思路是将大模型推理引擎中的KVCache视为智能体系统最关键的“物理工作记忆”。通过打破传统计算与存储的强耦合,Mooncake实现了Prefill与Decode的分离式架构,并构建全局共享的KVCache池。这样一来,多智能体在频繁交互协同工作时,就能通过跨节点的底层张量零拷贝与高效复用,达到“一次计算、全局共享”的效果。

4、演讲主题:SGLang HiCache + Mooncake的深度优化与企业级落地
嘉宾:陈凯悦,腾讯云高级工程师
简介:腾讯云异构计算团队基于SGLang HiCache + Mooncake的生产落地实践——与SGLang、Mooncake社区紧密协作,针对大规模并发启动、MTP投机推理兼容、跨实例缓存共享、RadixTree节点分裂导致缓存失效等真实场景的边界问题,共同完成了多项稳定性和性能优化,并向上游贡献了多个PR。落地效果:Prefill命中率从61.9%提升到89.1%,TTFT加速2.6倍,端到端延迟加速4倍,长上下文Input吞吐提升152%,并在客户环境中稳定运行。数据很能说明问题。

5、演讲主题:沐曦GPU对SGLang的深度适配与工程实践
嘉宾:杨鑫,沐曦股份SGL推理引擎核心开发者
简介:本分享将介绍SGLang在Metax GPU上的适配流程、最新模型支持情况、性能优化实践,以及2026年的Roadmap。国产GPU与开源推理框架的结合,正在走向更深的工程化阶段。

6、圆桌会议:异构算力下的推理效能革命——SGLang前沿优化与企业落地实践
主持人:李兆石,沐曦股份AI研究院院长
嘉宾:童心源(SGLang Core Maintainer)、常怀鑫(龙蜥社区SGLang项目开发者)、马腾(阿里云高级技术专家)、王志鹏(沐曦股份SGL推理引擎核心开发者)、陈凯悦(腾讯云高级工程师)

更多详细议程见下方海报:

热点追踪提示词
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:沐曦龙蜥SGLang技术MeetUp北京举办亮点抢先看要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
来源:https://developer.aliyun.com/article/1739608
人工智能

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关热点
AI热点2026-06-07 21:08
如何用ChatGPT解决Java Full GC频繁问题

通过ChatGPT解析FullGC日志定位根因,提取堆转储分析线索,并生成可执行JVM调优指令组合,高效降低FullGC频率与延迟,实现调优闭环,提升Java应用性能。

AI热点2026-06-07 21:08
飞书智能伙伴提示词如何控制培训课后作业标题与正文比例

在飞书文档中使用智能伙伴写培训课后作业时,需确保在文档内运行、用结构化指令锁定标题层级与正文密度,并在批量生成后统一清除格式并应用样式,从而控制标题与正文比例。

AI热点2026-06-07 21:08
Kimi联网搜索最新科学实验操作安全规范指南

利用Kimi联网搜索获取最新小学科学实验操作安全规范需先开启实时联网功能,再用“site:gov cn小学科学实验操作安全规范2026OR2025filetype:pdf”精准定位,优先筛选带“通知”“指南”的官方PDF文件,通过印发日期和文号交叉验证条款时效性。

AI热点2026-06-07 21:08
天工AI搜索选题可行性判断提示词输出层级控制方法

天工AI搜索用于选题可行性判断时输出层级易混乱。通过提示词设计可解决:用中文数字标定“总—分—判”框架,插入英文短横线分隔符锁死模块,或要求JSON格式嵌套字段,也可设定角色任务双锚点与反向禁令,使各维度判断清晰可验证。

延伸阅读