速看!DeepSeek开源周第一弹:FlashMLA加速GPU计算!
发布时间:2025-04-23 编辑:游乐网
?DeepSeek在开源周的第一天推出了加速推理的基础设置FlashMLA。DeepSeek针对Hopper GPU优化了高效的MLA解码内核,支持变长序列,并且已经投入生产使用。
✅ 支持BF16 ✅ 分页KV缓存(块大小64) ⚡ 在H800上实现3000 GB/s的内存带宽和580 TFLOPS的计算性能!
快速开始克隆项目代码语言:javascript代码运行次数:0运行复制```javascriptgit clone https://www.php.cn/link/3dc20e2ac60a2551a4d3f08b03377def
安装代码语言:javascript代码运行次数:0运行复制```javascriptpython setup.py install登录后复制
测试代码语言:javascript代码运行次数:0运行复制```javascriptpython tests/test_flash_mla.py
在H800 SXM5上,使用CUDA 12.6,在受内存限制的配置下可实现高达3000 GB/s的带宽,在受计算限制的配置下可达到580 TFLOPS的计算性能。登录后复制使用代码语言:javascript代码运行次数:0运行复制javascript from flash_mla import get_mla_metadata, flash_mla_with_kvcachetile_scheduler_metadata, num_splits = get_mla_metadata(cache_seqlens, s_q * h_q // h_kv, h_kv)for i in range(num_layers): ... o_i, lse_i = flash_mla_with_kvcache( q_i, kvcache_i, block_table, cache_seqlens, dv, tile_scheduler_metadata, num_splits, causal=True, ) ...
最低要求代码语言:javascript代码运行次数:0运行复制javascriptHopper GPUsCUDA 12.3 and abovePyTorch 2.0 and above
登录后复制相关阅读
MORE
+- 《DeepSeek》图片直接生成方法 05-28 deepseek怎么突破限制 05-27
- deepseek怎么复制没有星号 05-27 如何进行DeepSeek本地部署-DeepSeek本地部署指南 05-26
- 《DeepSeek》PC本地部署不同版本硬件配置要求介绍 05-25 《DeepSeek》历史记录删除方法 05-25
- 《DeepSeek》PPT生成教程 05-24 哪里有百度DeepSeek满血版搜索入口-百度DeepSeek满血版搜索入口在哪 05-20
- DeepSeek-R1模型本地部署如何选择版本(硬件要求与适用场景) 05-20 如何让DeepSeek生成内容更精准 05-19
- deepseek网页版如何上传文件 05-18 deepseek网页版怎么登录 05-18
- QQ音乐在线听 y.qq.com _QQ音乐网页版登录入口 05-17 DeepSeek使用常见问题有哪些-DeepSeek常见使用问题汇总 05-15
- DeepSeek API Client:轻松接入 DeepSeek AI 模型的 .NET 开发利器 05-15 WPS如何通过接入满血DeepSeek开启高效办公 05-15
- deepseek有什么作用 05-15 又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~ 05-13
热门合集
MORE
+热门资讯
MORE
+- 1 《第五人格》二十四节气演绎录 小满篇即将开启
- 2 即将开战《魔域口袋版》第四届跨服家族战
- 3 《街头篮球》超特火箭团 组队加速拿图章抽超特
- 4 Mac电脑玩《Droplets: Drops 对于孩子》攻略,轻松在苹果电脑上运行这款儿童游戏!
- 5 Mac上玩《Music Champion》攻略,如何在苹果电脑上畅玩这款iOS游戏?
- 6 Mac玩《保卫萝卜4》攻略,教你如何在苹果电脑上运行《保卫萝卜4》!
- 7 Mac上玩《Fun Night Music Battle 3D》指南,苹果电脑运行iOS游戏详解!
- 8 英勇之地cdk兑换码2025
- 9 Mac上玩《Train Kit: Wild West》指南,如何在苹果电脑运行这款游戏?
- 10 Mac上玩《武侠历险记》攻略,如何在苹果电脑运行《武侠历险记》