沐曦龙蜥SGLang技术MeetUp北京举办亮点抢先看

AI热点日报时间：2026-06-07

热点解读

沐曦、龙蜥与SGLang社区联合举办技术MeetUp，聚焦SGLang开源生态、国产GPU深度适配、Mooncake推理架构及AI性能分析工具等议题，通过技术分享与圆桌对话探讨国产算力与开源系统的协同演进。活动涵盖SGLang路线图、全链路可观测性、多智能体推理优化及企业级落地实践。

当高性能推理引擎遇上国产算力，技术落地的边界究竟能拓展多远？这个周六（6月6日），北京·融科资讯中心即将迎来一场硬核技术聚会——由沐曦股份、龙蜥社区、SGLang社区等生态伙伴联合推出的“沐‘蜥’芯生，开源共创——SGLang技术交流Meetup”。活动聚焦SGLang开源生态、国产GPU深度适配、Mooncake推理架构、AI性能分析工具等前沿议题，通过技术分享和圆桌对话，真正把国产算力与开源系统的协同演进推到台前。

当然，干货之外，龙蜥社区也为参会者准备了实用四件套、定制双包、环保帆布袋和精美本笔套装。期待大家带着前沿技术碰撞的火花，满载社区的心意而归。

本次MeetUp的演讲亮点抢先看——

1、演讲主题：SGLang Roadmap：面向大模型与多模态模型的高性能开源推理系统
嘉宾：童心源，SGLang Core Maintainer
简介：SGLang作为面向大语言模型与多模态模型的高性能开源推理框架，支持从单卡到大规模分布式集群的低延迟、高吞吐部署。这次分享将带来最新进展和未来发展路线图，涉及高效运行时、模型与硬件支持、工业界应用、开源社区协作，以及它在RL/post-training rollout后端中的实践。一句话概括：看看SGLang如何撑起下一代开放、可扩展的大模型服务生态。

2、演讲主题：从全链路可观测到智能分析：AI性能分析范式的演进与实践
嘉宾：苏峰，龙蜥社区SGLang项目开发者；常怀鑫，龙蜥社区智算联盟委员
简介：AI Agent加速落地的背景下，性能分析正在从“人工专家驱动”转向“Agent自主智能”。过去靠SGLang Tracing深入Runtime底层，可视化追踪精准捕获调度、KV Cache及GPU执行指标，让推理黑盒透明化。现在结合Agent与LLM，不仅能延续底层指标的洞察，还能自动瓶颈定位和根因分析。本分享将回顾SGLang可观测性建设历程，并探讨如何用新一代AI技术重构性能分析工作流——为构建高效稳定的AI服务保驾护航。

3、演讲主题：记忆感知驱动——基于Mooncake的多智能体推理架构优化
嘉宾：马腾，阿里云高级技术专家
简介：核心思路是将大模型推理引擎中的KVCache视为智能体系统最关键的“物理工作记忆”。通过打破传统计算与存储的强耦合，Mooncake实现了Prefill与Decode的分离式架构，并构建全局共享的KVCache池。这样一来，多智能体在频繁交互协同工作时，就能通过跨节点的底层张量零拷贝与高效复用，达到“一次计算、全局共享”的效果。

4、演讲主题：SGLang HiCache + Mooncake的深度优化与企业级落地
嘉宾：陈凯悦，腾讯云高级工程师
简介：腾讯云异构计算团队基于SGLang HiCache + Mooncake的生产落地实践——与SGLang、Mooncake社区紧密协作，针对大规模并发启动、MTP投机推理兼容、跨实例缓存共享、RadixTree节点分裂导致缓存失效等真实场景的边界问题，共同完成了多项稳定性和性能优化，并向上游贡献了多个PR。落地效果：Prefill命中率从61.9%提升到89.1%，TTFT加速2.6倍，端到端延迟加速4倍，长上下文Input吞吐提升152%，并在客户环境中稳定运行。数据很能说明问题。

5、演讲主题：沐曦GPU对SGLang的深度适配与工程实践
嘉宾：杨鑫，沐曦股份SGL推理引擎核心开发者
简介：本分享将介绍SGLang在Metax GPU上的适配流程、最新模型支持情况、性能优化实践，以及2026年的Roadmap。国产GPU与开源推理框架的结合，正在走向更深的工程化阶段。

6、圆桌会议：异构算力下的推理效能革命——SGLang前沿优化与企业落地实践
主持人：李兆石，沐曦股份AI研究院院长
嘉宾：童心源（SGLang Core Maintainer）、常怀鑫（龙蜥社区SGLang项目开发者）、马腾（阿里云高级技术专家）、王志鹏（沐曦股份SGL推理引擎核心开发者）、陈凯悦（腾讯云高级工程师）

更多详细议程见下方海报：

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：沐曦龙蜥SGLang技术MeetUp北京举办亮点抢先看要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://developer.aliyun.com/article/1739608

人工智能

上一篇：有道云AI项目计划甘特图时间线混乱提示词补充技巧

下一篇：如何写出MiniMax M3模型更容易理解的编程提示词避坑指南

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周360AI搜索抖音同类账号选题提示词篇幅格式控制 02 / 本周Notion AI表格字段说明提示词如何避免套话空话 03 / 本周即梦AI旅行短片提示词减少重复句式的实用技巧 04 / 本周通义万相角色一致性提示词如何生成一行一个标题 05 / 本周Gemini提示词精准写法万能公式与避坑指南全集

01 / 本月360AI搜索抖音同类账号选题提示词篇幅格式控制 02 / 本月Notion AI表格字段说明提示词如何避免套话空话 03 / 本月即梦AI旅行短片提示词减少重复句式的实用技巧 04 / 本月通义万相角色一致性提示词如何生成一行一个标题 05 / 本月Gemini提示词精准写法万能公式与避坑指南全集

热点快看

06-07 21:14360AI搜索抖音同类账号选题提示词篇幅格式控制 06-07 21:14Notion AI表格字段说明提示词如何避免套话空话 06-07 21:14即梦AI旅行短片提示词减少重复句式的实用技巧 06-07 21:14通义万相角色一致性提示词如何生成一行一个标题 06-07 21:13Gemini提示词精准写法万能公式与避坑指南全集

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别