当前位置: 首页
AI
新浪微博开源VibeThinker-1.5B:1.5B小模型挑战千亿巨量参数

新浪微博开源VibeThinker-1.5B:1.5B小模型挑战千亿巨量参数

热心网友 时间:2025-11-14
转载

11月13日,新浪微博正式发布了其首个开源大模型 VibeThinker-1.5B,主打“小模型也能拥有大智慧”的理念。

以下是该模型的核心介绍:

当前行业顶尖模型的参数量普遍突破1万亿,部分甚至达到2万亿规模。这不禁让人思考:是否只有庞大的参数才能实现高度智能?是否只有少数科技巨头才有能力打造大模型?

VibeThinker-1.5B 正是微博AI对这一问题的有力回应,它证明了小模型同样可以实现高智商表现。这意味着构建最强模型不再像传统认知那样主要依赖堆砌参数量,通过巧妙的算法设计同样能够达到这一目标。

这款模型仅包含15亿参数,经过微博AI研发团队提出的创新“频谱到信号原理”(SSP)训练方法后,其表现令人惊艳:VibeThinker 在 AIME24、AIME25 以及 HMMT25 三个高难度数学测试集上的表现,超越了参数量超过其400倍的 DeepSeek-R1-0120 版本(模型大小671B),与规模为456B的 MiniMax-M1 效果相当或更优;在 LiveCodeBench v6(编程算法题测试集)中的成绩,成功追平参数量数十倍于它的模型,比如欧洲领先AI企业 Minstral.AI 的深度思考模型 Magistral-Medium-2506 版本。

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

新浪微博发布其首个开源大模型 VibeThinker-1.5B,小模型挑战巨量参数对手

VibeThinker 的强大能力并非来自参数堆砌,而是源于微博研发团队提出的 SSP 训练理念。该理念强调在学习阶段鼓励模型发散探索所有可能的解题路径,而非一味关注正确率;随后通过强化学习进行高效策略优化,精准锁定正确路径,将模型性能提升至极致。

该模型的单次“后训练”(Post-Training)成本不足8000美元。相比之下,DeepSeek-R1 和 MiniMax-M1 的后训练成本分别是29万美元及53万美元,成本降低了数十倍。

VibeThinker-1.5B 的开源,旨在为全球计算资源有限的中型企业及高校研究团队,提供一条高性价比的研发新路径。这使得人人都可以训练最前沿的大模型,而不像之前那样被排斥在外,这对于业界技术进步至关重要。

Github:https://github.com/WeiboAI/VibeThinker

HuggingFace:https://huggingface.co/WeiboAI/VibeThinker-1.5B

Arxiv:https://arxiv.org/pdf/2511.06221

ModelScope:https://www.modelscope.cn/models/WeiboAI/VibeThinker-1.5B

来源:https://www.ithome.com/0/897/269.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Claude Code复活三年烂尾代码:与Anthropic CEO共著Nature论文实战

Claude Code复活三年烂尾代码:与Anthropic CEO共著Nature论文实战

在华盛顿大学基因组科学系,干了快二十年的首席开发者Brendan MacLean,正盯着屏幕上那段代码,眉头越锁越紧。 这段代码属于Skyline的一个功能模块,文件视图面板,搁置了整整一年。 写它的开发者毕业离开了实验室,留下一个半成品。放在以前,这种烂尾工程只有一个结局,永远躺在仓库里,没人敢碰

时间:2026-05-17 19:31
爱奇艺纳豆Pro清理缓存方法与步骤详解

爱奇艺纳豆Pro清理缓存方法与步骤详解

在使用爱奇艺纳豆Pro进行视频创作时,如果遇到操作卡顿、界面加载缓慢或频繁提示存储空间不足,这通常是由于长期积累的缓存数据未能及时清理所致。作为一款深度集成于浏览器及客户端的智能影视制作工具,其缓存管理需结合具体的运行平台来处理。无需担心,以下将为您提供一套系统、安全的缓存清理方案,帮助纳豆Pro恢

时间:2026-05-17 19:30
OpenClaw记忆机制核心文件解析与工程实现详解

OpenClaw记忆机制核心文件解析与工程实现详解

许多用户在使用传统AI助手时都曾遇到过这样的困扰:每次对话都像是初次见面,助手无法记住之前的交流内容、个人偏好或工作习惯,导致每次互动都需要重新开始。这种缺乏连续性的体验,往往降低了工作效率和交互的深度。 OpenClaw为解决这一问题,提出了一个直接而巧妙的方案:利用本地文件实现持久化记忆。它将A

时间:2026-05-17 19:30
AI定格动画制作教程:Seedance 2.0特殊帧控制详解

AI定格动画制作教程:Seedance 2.0特殊帧控制详解

如果你希望借助AI工具创作出带有手工质感和节奏张力的定格动画,却苦于传统图生视频效果过于流畅、缺乏标志性的“逐帧停顿感”,那么Seedance 2 0的特殊帧控制功能或许能为你打开一扇新的大门。它提供了几种巧妙的路径,帮助你精准实现卡点停帧的效果,轻松制作AI定格动画。 一、使用首尾帧强制定格法 这

时间:2026-05-17 19:30
AI洗牌时代SaaS企业如何像章鱼般灵活生存

AI洗牌时代SaaS企业如何像章鱼般灵活生存

AI技术的指数级发展,正像一场重塑生态的“小行星撞击”,成为所有SaaS企业必须应对的战略拐点。而自然界中存活了3亿年的章鱼,其核心生存智慧——分布式智能与快速适应,恰好为SaaS行业的进化指明了方向。成功的SaaS企业需要超越“技术驱动”的传统思维,通过模块化架构拥抱AI的快速迭代,真正从客户业务

时间:2026-05-17 19:29
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程