阿里QwQ-32B正式发布或成671B最佳替代方案
2025年3月6日,阿里云通义千问官方微博正式发布了全新的推理模型——QwQ-32B,并同步进行开源。该模型虽然仅拥有320亿参数,但其性能表现足以与拥有6710亿参数的DeepSeek-R1正面较量——需要注意的是,后者实际被激活的参数也仅为370亿。这意味着,在数学推理、代码生成以及通用智能等关
在开源方面,阿里云选择在 Hugging Face 与 ModelScope 两大平台同步开源,采用 Apache 2.0 协议。这意味着任何个人或企业均可自由下载、商用,无需担心授权问题。在 Hugging Face 的大模型排行榜上,QwQ-32B 已成功登顶,充分展现了其实力。
如果你也想体验这一模型,可以通过以下方式获取:
- Hugging Face:https://huggingface.co/Qwen/QwQ-32B
- hf 镜像站:http://hf-mirror.com/Qwen/QwQ-32B
- Ollama:https://ollama.com/library/qwq
直接在 Ollama 拉取也非常简单,一条命令即可完成:
```
ollama run qwq
```
对比 DeepSeek-R1 671B 满血版,QwQ-32B 在资源占用上的优势极为突出。在 Ollama 平台上,Q4 量化版仅需 20GB 显存,即使运行全量模型,所需显存也不超过 80GB,普通消费级显卡即可流畅推理。此外,有消息称该模型的研发获得了 DeepSeek 相关人员的技术支持——虽然未经官方证实,但如果属实,这次“小模型挑战大模型”的胜利将更加耐人寻味。
QwQ-32B 的发布对整个行业的影响不言而喻。尤其是那些此前花费巨资部署 DeepSeek-R1 满血版的企业,现在或许会感到一些压力。但换个角度来看,这恰恰是技术快速迭代带来的红利。自 DeepSeek 开源以来,大模型行业的创新速度明显加快,头部企业之间的竞争日趋白热化。对用户而言,这无疑是件好事——更低的成本、更强的性能,让 AI 落地变得更加触手可及。期待这些头部企业能带来更多像 QwQ-32B 这样的优秀作品。 你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:阿里QwQ-32B正式发布或成671B最佳替代方案要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点小米MiMo开放平台宣布,MiMo-V2系列的四款模型将于2026年6月30日正式下线,平台已推动开发者向V2 5系列迁移。具体涉及mimo-v2-pro、mimo-v2-omni、mimo-v2-flash和mimo-v2-tts模型。平台设置了系统替换时间作为缓冲:pro和omni模型于2026
2026重庆车展上,2026款长安猎手K50正式上市,共推出10款车型,售价14 19万至17 89万元。新车主要针对续航、电池和动力进行升级,搭载2 0T增程系统与双电机,纯电续航超180公里,快充仅需16分钟。全系标配30kW外放电功能,储备电量达239kWh,并新增山地与涉水模式,提升通过性。
上海期货交易所与上海市普陀区人民政府于6月12日签署战略合作协议,旨在建立长期共赢的合作机制,共同服务上海国际金融中心与国际贸易中心的联动发展。双方高层领导均出席签约仪式,彰显了对此次合作的高度重视。协议聚焦于发挥期货市场专业资源与区域发展综合优势,深化务实合作,探索金融创新与实体经济深度融合,以期
6月12日,世纪华通发生一笔大宗交易,以每股14 37元的价格成交757 24万股,成交总额为1 09亿元。值得注意的是,该成交价与当日市场收盘价持平,属于平价交易。此次交易额占该股当日总成交额的1 51%。市场分析认为,平价成交反映了买卖双方对当前股价水平的共识,交易行为相对平稳,未对市场预期造成
- 日榜
- 周榜
- 月榜
热点快看
