亿估值DeepSeek如何花掉500亿融资
6月29日,DeepSeek官宣了一个消息:V4正式版将在7月中旬和大家见面。 公告里说,为了更合理地配置资源、提升服务稳定性,正式版上线后API的定价策略也会跟着调整,会引入峰谷定价机制。 过去这两周,DeepSeek身上的大新闻还不止这一个。还有两件事同样值得认真说说: 一是6月16日,Deep
6月29日,DeepSeek官宣了一个消息:V4正式版将在7月中旬和大家见面。
公告里说,为了更合理地配置资源、提升服务稳定性,正式版上线后API的定价策略也会跟着调整,会引入峰谷定价机制。
过去这两周,DeepSeek身上的大新闻还不止这一个。还有两件事同样值得认真说说:
一是6月16日,DeepSeek完成了成立以来的首轮外部融资,募资总额510亿元,估值直奔4000亿元。这个动作直接打破了创始人梁文锋此前立下的“不融资、不上市、不商业化”的原则。
二是融资后仅仅十几天,6月27日,DeepSeek团队就和北京大学联合发了一篇新论文,题目是《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,梁文锋本人的名字也出现在论文作者名单里。
如果DeepSeek上半场要证明的是“我能做出世界一流的大模型”,那么到了下半场,当资本和技术这两股力量交汇到一起,它的使命就变了——得拿着融来的钱,向大家证明:我不仅仅是个技术实验室,我是真正意义上的商业公司。
500亿之后,DeepSeek开始补人
融资一落地,DeepSeek Harness团队的新负责人崔添翼就忙了起来。
6月25日晚上,DeepSeek在社交平台发了一轮大规模招聘,覆盖算法、研发、运维、产品、数据工程师以及职能部门,总共7大类、33个岗位。工作地点包括北京和杭州,所有岗位都接受实习生。
在DeepSeek官网、Boss直聘、X、小红书这些平台上,都能看到这位梁文锋的浙大校友、今年3月才加入团队的负责人亲自下场招人,时不时还得抽出精力来“辟个谣”。

图为 崔添翼在小红书上回应“DeepSeek招人卡清华级学历,还卡豆包经历”的评论
过去,DeepSeek给人的印象一直是沉默寡言、闷头干活的纯技术团队。背靠梁文锋创办的量化私募“幻方量化”——这家基金2025年年化收益率高达56.55%,管理规模超过700亿元——DeepSeek压根不需要依赖外部资本。在外界看来,它“根本不差钱”。
那么,是什么让梁文锋改变了对融资的态度?核心原因很可能来自一个现实压力:人才流失的风险在加速,外部抢人大战越来越激烈。
对照一下市场上已经跑在前面的玩家就知道了。“大模型第一股”智谱,截至6月30日总市值已经接近万亿港元;MiniMax的市值也超过了1300亿港元。反观DeepSeek,员工手里的期权一直是一张白纸——公司不融资、不上市、没有外部估值作为参考。
一位接近DeepSeek的资深从业者点出了关键:“不融资,估值就上不去。员工手里就算有期权,价值也不会涨。再看智谱、MiniMax,要么估值暴涨,要么上市后猛涨。这么一比,DeepSeek的员工肯定留不住。”留住人才的成本,可不是一笔小数目。
2025年,DeepSeek最大的竞争优势,是一支只有百余人、但全是高学历“天才”组成的团队。几十位顶尖研究员,加上一位极具技术理想主义色彩的创始人梁文锋,一起做出了DeepSeek-R1。但到了今年,形势变了——一边是各大互联网公司持续用高薪挖顶级AI研究员,另一边,市场对AI人才的需求量猛涨。公开数据显示,算法岗位月薪的中位数普遍超过2.4万元,头部人才的月薪甚至超过5万元。AI人才的溢价正在持续扩大。
这次大规模招聘中,除了全栈开发/算法、AI核心系统研发、运维、产品这些核心岗位,还有一个值得留意的变化:HR、法务、财务、采购、行政等职能部门也在同步扩招。
全方位“扩编”释放出的信号很清楚:DeepSeek正在补齐自己作为一家科技公司的组织能力。从“产品驱动”走向“组织驱动”,这是很多科技公司都要走的路——组织架构逐步成熟、平台不断完善、人才激励机制建立起来之后,大规模的产品红利才会真正释放出来。
完成500亿融资,一方面是留人的需要,另一方面也给完善组织架构提供了基础条件。但真正的问题在于:在扩招之后,DeepSeek还能不能保持以前那种“小团队作战”的精简高效和决策敏捷?这是DeepSeek“下半场”需要回答的第一个问题。
DeepSeek走向重资产
在6月25日发布的33个招聘岗位里,有一类岗位值得特别留意——IDC(互联网数据中心)团队,涉及基础设施建设。
事实上,早在4月中旬,DeepSeek就已经在内蒙古乌兰察布发布了首批数据中心岗位,包括数据中心高级运维工程师和数据中心高级交付经理。到了6月,又新增了“IDC设计规划工程师”这个岗位。
从数据中心运维、交付到设计规划,今年以来,DeepSeek的人才布局已经从模型层面延伸到了算力基础设施建设。

图为 DeepSeek IDC数据中心团队招聘岗位信息
大模型进入规模化训练和推理阶段后,AI模型公司之间的竞争必然要升级到“基础设施”层面的硬件竞赛。这迫使DeepSeek像硅谷最前沿的头部大模型公司一样,加入自建算力集群的重资产“烧钱”游戏。
公开数据显示,美国科技巨头Alphabet、亚马逊、Meta和微软,预计今年总共要投资大约6500亿美元来扩建人工智能相关基础设施。Anthropic和OpenAI也在公开的财务文件中多次强调,会持续加大算力基础设施投入。
举个具体的例子:Anthropic预计,光是数据中心容量租赁这一项,每个月就要向SpaceX支付约12.5亿美元,一年就是150亿美元。这还不包括采购GPU、网络设备和运维的成本。
工信部信息通信经济专家委员会委员盘和林在之前的采访中指出,当前AI投资热潮之下,大模型企业融资已经是大势所趋。“不仅是DeepSeek,谷歌也融资了800亿美元。整个行业已经进入了重资本阶段。”
为了不在算力基础设施的军备竞赛中掉队,DeepSeek必须从资金上“开源”,拿到融资,然后投入到算力和数据中心的建设里去。
值得注意的是,DeepSeek建设算力基础设施面临的特殊挑战是:海外先进算力的出口受到限制。这意味着,它的算力将由国产芯片来驱动。而在DeepSeek V4发布时,官方页面和技术报告里就已经提到了对国产算力的探索。
5月底,华&为提出了“韬(τ)定律”,试图通过器件、芯片、系统等全栈协同优化,来突破摩尔定律放缓带来的瓶颈。与此同时,国产大模型也在加速适配国产算力。算力探索的目标很明确——“自主可控的AI基础设施”。
AGI的前夜
对DeepSeek这样的基础模型公司来说,光有资本和组织架构是不够的。要长期保持领先,核心还是得有持续的原创技术产出。
一位资深算力从业者也强调,DeepSeek本轮大规模融资,目的就是为了激励团队、留住核心人才。“只有融到足够的钱,才能训练出好模型,才能奠定头部位置。”
论文,是追踪DeepSeek新技术探索的一个重要窗口。
据不完全统计,近两年DeepSeek公开发表了大约27篇核心技术论文。研究范围覆盖MoE(混合专家)、强化学习、代码大模型、数学推理、多模态等等——几乎对应了它每一代核心模型和每一次关键技术突破。
就在6月27日,DeepSeek官方在GitHub上低调更新了一篇与“DSpark”新技术相关的论文。

论文中,DeepSeek提出全新的推理加速框架“DSpark”,在不改变模型能力的前提下,大幅提升了大模型推理速度和系统吞吐
跟以往的论文不同,这篇不是迭代新模型,而是在原有的DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上,增加了一个推测解码模块。重点在于工程落地层面的优化。
DeepSeek的目标是,把DSpark部署到DeepSeek-V4的线上服务系统里、承接真实用户流量时,能够减少无效校验造成的算力浪费。论文中提到,“在不改变底层模型架构的情况下,将生成速度提高了60-85%。”对每天处理海量API请求的AI公司来说,算力成本每降低一点,利润空间就增加一点。
据VentureBeat今年2月份的消息,模型训练的费用只会越来越高。Anthropic的CEO Dario Amodei预测,未来一代前沿模型的训练成本将高达50亿到100亿美元。上述资深算力从业者也表示,DeepSeek接下来也会进入同样“烧钱”训练模型的阶段。为了支持模型训练的持续迭代,融资是迟早的事。
更多的媒体解读认为,融资后仅十几天就上线了新论文,DeepSeek似乎在向外界证明:公司的核心节奏没有变,研发团队依旧保持着高频率的技术输出。
不论是上新模型、建设数据中心,还是从“天才实验室”转变为商业化运营的AI公司,DeepSeek进化的最终目标是AGI。
在2024年接受《暗涌Wa ves》采访时,梁文锋就已经明确表态:“我们做的就是AGI(通用人工智能)。语言大模型可能是通往AGI的必经之路。”
以前在免费阶段,用户对响应失败、对话中断、API限流这些问题还能容忍。但等到7月DeepSeek V4正式版上线后,用户对稳定性的要求会大幅提升。如果问题持续存在,将直接影响用户是否愿意把DeepSeek接入真实的工作流和业务系统。到了付费端、开发者生态和企业级场景,DeepSeek的工程能力将面临更严格的考验。模型能否真正走向大规模应用,也是进入AGI时代必须跨越的一道坎。
当用户希望DeepSeek推动中国大模型降本增效的时候,它自己心里还算着一笔账:眼下正处在AGI的关键时期,首要目的是留住人才,其次要持续训练模型、不断在技术层面迭代出新,数据中心的基础设施建设这场“仗”也绝对不能输。光靠梁文锋的量化私募幻方量化,远远不够。
2026年,DeepSeek启动融资是个必然的选择。正如DeepSeek在6月25日晚上发布的招聘公告里写的那句话:
“当今人类正处于AGI的前夜。”
下一步,DeepSeek要面对的是更长期、更烧钱的AGI竞赛。它能不能像在“大模型”竞赛中那样再次出圈,继续在AGI的路上“领跑”——这是DeepSeek“下半场”必须回答的第二个问题。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:亿估值DeepSeek如何花掉500亿融资要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点在招聘这个行业中,数据录入的繁琐程度相信大家都有切身体会。每天需要从各类网页、社交平台、招聘站点中搜寻候选人信息,再手动一条条录入系统,既耗时费力又容易出错。今天要介绍的这款Kwal Chrome插件,正是为了彻底解决这一痛点而设计的。什么是 Kwal Chrome 扩展程序 插件?该插件的定位十分
网红经济正在进化——Twinning AI带来的玩法是:粉丝可以直接跟你的人工智能分身聊天,而你,每次互动都能收到真金白银。它集成了专业的声音克隆、文本和语音消息,以及数据分析能力,让粉丝互动变得既有趣又能变&现。 什么是Twinning AI? 简单来说,Twinning AI允许网红创建一个属于
在跨境电商和全球业务快速发展的今天,发票与财务管理工具的重要性日益凸显。AI技术的加入,让这些原本繁琐的流程实现了质的飞跃。Invoicemint 正是这样一款专注全球企业的智能发票与财务管理软件——它不只是一个简单的发票生成器,而是一套覆盖从开票、对账到税务合规、催款的全链路解决方案。 什么是In
想象一下,你随时都能找到一个倾听者——不带任何偏见,不会感到疲惫,而且完全匿名。这听起来像科幻小说里的情节,但现在已经成为现实。MyWhy 就是这样一款 AI 心理治疗应用,它将专业的情感支持装进你的口袋,让心理健康服务不再是奢侈品,而是像打开手机一样触手可及。什么是MyWhy?简单来说,MyWhy
- 日榜
- 周榜
- 月榜
热点快看
