当前位置: 首页
AI
微博逆袭!15亿参数模型成本仅7800美元,数学赛场击败DeepSeek

微博逆袭!15亿参数模型成本仅7800美元,数学赛场击败DeepSeek

热心网友 时间:2025-11-19
转载

正当全球AI行业陷入“堆砌参数、比拼规模”的白热化竞争时,微博AI却以一种截然不同的姿态闯入大众视野——其自主研发的开源大模型VibeThinker,仅凭150亿参数量的轻量化架构,竟在国际顶级数学竞赛基准测试中力压参数量高达6710亿的DeepSeek-R1,以颠覆性表现引发行业震动。更令人惊讶的是,这一成果的达成仅需7800美元的后训练成本,相较于同类模型动辄数十万美元的投入,成本效率提升了数十倍,为AI产业从“规模至上”转向“效率优先”提供了全新范式。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

长期以来,AI行业普遍认为模型的复杂推理能力必须依赖千亿级参数支撑,小模型因算力限制难以突破高难度任务。然而,微博AI团队通过优化模型架构与训练模式,创新性提出“频谱到信号原理”(SSP)方法,成功挖掘出小模型的隐藏潜力。在AIME24、AIME25及HMMT25等高难度数学测试中,VibeThinker的表现不仅超越了参数量超400倍的DeepSeek-R1-0120版本,还与4560亿参数的MiniMax-M1效果相当,甚至可媲美Gemini 2.5 Flash和Claude Opus等头部模型。在编程算法测试集LiveCodeBench v6中,其成绩也追平了欧洲领先AI企业Minstral.AI的Magistral-Medium-2506版本,彻底打破了“参数决定能力”的行业认知。

成本优势是VibeThinker的另一大亮点。据公开数据显示,2025年主流大模型单次后训练成本普遍在数十万美元级别。例如,MiniMax的M1模型使用512块H800 GPU训练三周,租赁成本约53.5万美元;DeepSeek的R1模型训练成本为29.4万美元(不含基础模型开发费用)。相比之下,VibeThinker的后训练过程(包括监督微调与强化学习阶段)仅消耗3900个GPU小时,按市场价格计算,总成本仅7800美元。这意味着,其成本效益比高达30至60倍,使高阶AI推理能力不再局限于科技巨头,中小型机构也能以极低门槛参与前沿创新,推动行业向更开放、多元的方向发展。

尽管VibeThinker目前仍处于实验性版本阶段,其研发重点聚焦于强化小模型在数学与编程领域的能力,尚未针对日常聊天等场景进行优化,但技术价值已引发全球关注。HuggingFace平台甚至主动发文宣传其论文,凸显行业对其创新性的认可。更值得关注的是,这一成果为AI产业提供了新的技术路径:通过算法优化而非单纯扩大规模,同样能实现性能跃升,这或将重塑行业的技术评价标准与资本布局逻辑。

技术突破的最终目标在于落地应用。微博早在AI领域布局多年,其自研的“知微”大语言模型已通过备案,并衍生出微博智搜、内容总结、AI互动号等功能。其中,微博智搜通过分析平台海量内容构建可信知识图谱,实现精准需求捕捉与情感理解,月活跃用户突破5000万;评论罗伯特作为AI互动账号,以独特的毒舌风格与温情进化路线吸引近200万粉丝,成为用户热议的“社交伙伴”。随着VibeThinker的加入,微博计划将其与心理学等垂直领域的数据资产深度融合,打造更懂用户情绪、更贴合社会需求的专属模型,进一步解锁数据生态的深层价值。

未来,VibeThinker有望成为微博AI应用的核心引擎。其技术能力不仅可优化智搜等产品的用户体验,还能突破场景边界,催生兼具社交属性与智能服务的新生态。例如,在智能搜索中降低算力损耗,在实时互动中提升响应效率,使平台在规模化部署AI时无需承担过高资源压力。这一变化将释放微博的生态创新能力,为用户带来更丰富、便捷的智能体验,同时也为AI技术的普惠化提供可复制的实践样本。

来源:https://www.itbear.com.cn/html/2025-11/1022760.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
我把 Anthropic 的 Harness 工程思想做成了一个 Skill

我把 Anthropic 的 Harness 工程思想做成了一个 Skill

用AI写代码,难在哪儿? 用AI生成代码本身并不难,真正的挑战在于让它稳定地交付一个真正可用的东西。这篇文章,我们就来聊聊Anthropic工程团队是如何破解这个难题的,以及我如何将这套方法论落地成了一个可以复用的实战工具。 用 AI 写代码有多难?不是写不出来难,是让它稳定交付可用的东西很难。这篇

时间:2026-04-06 16:53
沃尔玛、塔吉特等美国零售巨头拥抱 AI,明确用户需为购物助手出错担责

沃尔玛、塔吉特等美国零售巨头拥抱 AI,明确用户需为购物助手出错担责

美国零售巨头拥抱AI新玩法:功能归我,风险归你? 最近有件事挺有意思,美国那边的大型零售商们,正铆足了劲把AI往购物流程里塞。但你猜怎么着?一旦AI捅了娄子,买单的却很可能变成了消费者自己。 这不,就在当地时间4月5号,外媒Futurism的一篇报道就点破了这个现象。企业们一边热火朝天地推广AI功能

时间:2026-04-06 13:52
小米物流大件“当日达”服务上线 50 城

小米物流大件“当日达”服务上线 50 城

小米物流大家电“当日达”实现全国50城覆盖,上午11点前下单最快当日送达 对于大家电配送时效长的普遍困扰,小米物流带来了全新的解决方案。最新消息显示,小米旗下大件商品的“当日达”服务范围已成功拓展至全国50座重点城市。除了北京、上海、广州、深圳、杭州、成都等一线与新一线核心城市外,此次升级还囊括了天

时间:2026-04-06 11:57
为什么现在很多人觉得 OpenClaw 不好用

为什么现在很多人觉得 OpenClaw 不好用

当前开源版本的定位 你得明白,当前的开源版本,本质上更偏向于一个**开发者工具链**,而非一个即开即用的完整产品。它的核心组件非常明确: 一个基于 Node js 的运行环境 (runtime) 一个网关 (gateway) 插件与技能 (plugins skills) JSON 配置文件 命令

时间:2026-04-06 11:02
WorkBuddy工具

WorkBuddy工具

好的,我已准备好作为您专属的 SEO 内容优化专家开始工作。我将严格遵循您的所有指令,在不触碰任何 HTML 标签、属性及图片代码的前提下,专注于对纯文本内容进行深度优化与重写,以提升其在搜索引擎中的可见性与吸引力。 我的核心工作流程是:首先,我会精准解析您提供的原始文章,确保核心事实与信息结构毫发

时间:2026-04-06 08:34
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程