当前位置: 首页
AI
梁文锋创立DeepSeek的创业历程与背后故事

梁文锋创立DeepSeek的创业历程与背后故事

热心网友 时间:2026-05-16
转载

2025年开年,科技圈最耀眼的名字非梁文锋莫属。短短几天,他成长中的诸多细节被置于聚光灯下,甚至连那套没来得及装修、只在里面搭了帐篷睡觉的新房,都成了他独特个性的注脚。

个性固然引人谈论,但绝非成功的核心密码。过去十几年,这位一度籍籍无名的大学生所能倚仗的,唯有他的思想与能力。

一个绕不开的问题是:为什么是梁文锋做出了DeepSeek?时代机遇与他迥异于常人的经历固然重要,但若要深究,理解梁文锋其人,才是理解这一切的关键。

找人才不需要标签

帮梁文锋的公司招人,在猎头圈里是出了名的“硬骨头”。

一位从2021年就开始与幻方深度合作的猎头坦言,这个过程让人“想哭”,难度太高。“清华本博,手握六篇顶会论文,你觉得总该稳了吧?嘿,简历直接挂了。另一个清华本科、MIT博士背景的候选人,第二轮面试也没能通过。”

在他看来,如果要从大厂内部物色人选,幻方和DeepSeek的目光基本不会停留在国内公司,他们的对标对象始终是Google、Meta这类海外巨头。

另一位猎头谈到DeepSeek也忍不住头疼:“要求太挑剔了。曾经推荐过一位在字节跳动绩效非常出色的年轻中层,聊完还是没通过。我很纳闷,去问原因,得到的反馈是:‘这个人对AI缺乏真正的热情。’可人家明明做过AI Agent相关的项目啊,一般很少会得到这样的评价。”

在梁文锋这里,人才没有固定标签。不唯学历背景,不唯过往业绩,他只看重两样东西:个人能力与个人素质。

正是这种极高的人才门槛,锻造了今天的DeepSeek。在国内大模型团队中,若论人才队伍的规模厚度,DeepSeek或许不及顶尖大厂;但若论人才的密集度和精锐程度,它绝对位列第一梯队。

要留住这些顶尖人才,除了DeepSeek提供的高薪酬,还有一套充分尊重创意与想法的管理模式。所谓“无固定团队、无汇报关系、无年度计划”,与其说是一种管理制度,不如说是一种彻底的信任。《奈飞文化手册》里有一句话:“优秀的同事和艰巨的挑战,是吸引人们来公司工作的最大因素。”对于AI从业者而言,还有什么比AGI(通用人工智能)更艰巨、更迷人的挑战呢?

做最难的事,就要找到最好的人,然后给予充足的资源与信任。被信任的顶级人才所迸发的能量是惊人的,这一逻辑在抖音的崛起中早已得到验证。

2018年春节期间,抖音日新增用户突破千万量级。一位当时负责增长的产品经理后来回忆,那个增长项目完全没有设定绩效压力,而且他只是向财务发了一封邮件,账户里就多出了上亿元的投放预算。他当时就意识到:“这样的团队,做什么不能成?”

DeepSeek走的也是同样的路数。简历被筛掉,问题绝不会出在学历上;面试通不过,也肯定不是能力不行。他们对人才的核心诉求,最终可以归结为一句话:这个人,是可以被信任、能一同向AGI目标长期奋斗的伙伴吗?

这便是DeepSeek的人才观。理解了这一点,便是理解梁文锋的第一步。

极简主义的世界观

尽管深耕量化领域多年,梁文锋并不认为自己是个“搞金融的”。他对自己的定位是:“我是做AI的,只不过恰好应用在量化场景。”

几乎所有与梁文锋有过交流的人,都会提到他那种不受外界干扰的特质:“他的思维方式极其纯粹,特别注重第一性原理”,“说话语速很慢”,“但一开口就能切中要害”。

量化投资的特性,恰好契合了他这种极简主义风格——无需与复杂的上下游产业链周旋,只需专注于最纯粹的市场数据本身。

直到今天,梁文锋依然常常沉浸在自己的技术世界里,心无旁骛地解决问题。例如,对于做大模型这件事,他的看法直接而纯粹:“想清楚了就能干,只要有算力卡就行。”其他的困难,似乎都不在主要的考虑范围之内。

对待金钱,他同样秉持着这种极简逻辑。钱,就是用来投资或者做慈善的,只要花在了合适的地方,亏损本身并不值得过多计较。

2023年底,一个旨在扶助聋哑人士的手语大模型项目为寻求投资找到了梁文锋。他当时就指出,这个项目的优点是公益属性突出,缺点是市场规模有限,潜在隐患则在于:这是一个顶尖高校大学生主导的项目,团队能否长期坚持是个问号。

尽管很清楚这笔投资极有可能没有任何经济回报,他仍然表示,只要团队愿意继续推进,他就愿意投入支持。

过去,梁文锋每年会拿出约5亿元用于投资或慈善。现在,他把这笔钱花在了DeepSeek上。炒股是为了赚钱,投入大模型是为了AGI,目的清晰,仅此而已。

DeepSeek拥有近两万张算力卡,梁文锋在算力投入上显得极其慷慨。他对上述手语大模型团队承诺过,算力集群可以随时向他们开放。但另一方面,他又有点“小气”,对这近两万张卡的利用率要求极高,力求打满,避免空转浪费。

这两种看似矛盾的行为,如果用极简主义的视角来解读,就完全说得通了:算力卡的存在就是为了被使用的,物尽其用,避免浪费,这是最基本的原则。

不以商业化为限

没花一分钱投放费用,DeepSeek的App仅用7天就收获了过亿用户。对于这个增长奇迹,梁文锋怎么看?有投资人在春节期间专门问过他,但梁文锋似乎对如此巨大的流量毫不在意,他的回答是:“这距离AGI的路还很远。”

这并非故作姿态。据了解,DeepSeek只安排了两三个人负责App维护、对话网页开发以及充值后台管理。因此,它的产品体验不够“丝滑”,也就不难理解了。

相比之下,DeepSeek在B端市场的事迹流传更广。例如,此前他们私有化部署的定价仅为45万元,其中不仅包含一台H20或910b服务器的使用权,还附赠大模型服务,期限一年。而同样的价格,在某些云服务商那里,仅仅只能租到一台910b一年的使用权。这意味着,DeepSeek相当于近乎免费提供了自己的大模型能力。

私有化部署不赚钱,DeepSeek似乎也不在乎通过API赚钱。一位曾对接DeepSeek的大厂员工吐槽,它身上有种“爱用不用”的气质——服务总是很难用,也总是不怎么调整。

再大的客户、再高的调用量,似乎也得不到特殊关照。所有用户高峰期都要排队,体验不佳。大客户的反馈很多,要求DeepSeek扩容、再扩容,至少让响应流畅些,不要两次请求就有一次失败,尤其在客服这类场景中,这种失败几乎无法忍受。

外界喧闹纷纷,但梁文锋看起来并不十分在意。那位大厂员工曾私下与DeepSeek的员工交流如何改善,得到的反馈是:梁文锋认为,大厂完全有能力自己想办法解决请求失败的问题,他们应该为自己兜底,而不是过度依赖DeepSeek来保障服务稳定性。

这个回答简直让人哭笑不得:“我们可是DeepSeek的顶级客户啊。”

可以说,现阶段的梁文锋,并不在意商业化的种种可能性。

当不少团队纷纷投身于应用层开发时,梁文锋曾对一位好友说:“你不要一直盯着应用和行业落地的事情,现在去看只会把自己禁锢住,因为时机还没到。现在能想到的一切,可能都是错的。更糟糕的是,你还会在错误的道路上投入更多时间、精力和金钱。”

这既是对好友的忠告,也是他自己的行动准则。将精力分散到应用探索或商业化变&现上,对梁文锋而言,无论具体做什么,都可能是一条偏离主航道的“错误道路”。

而正确的道路,从来只有一条。他认为,自己正走在这条路上。

来源:https://www.leiphone.com/category/ai/5ls84pKK7sriwxLJ.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
零一万物迎来三位新高管 李开复详解一把手工程

零一万物迎来三位新高管 李开复详解一把手工程

零一万物近期完成核心高管团队调整。前百度高管沈鹏飞加盟,统筹国内ToB与ToG业务拓展。同时擢升赵斌强、宁宁为副总裁,分别负责AI模型研发与国际业务咨询。此次布局旨在协同市场、技术与国际三大方向,全面升级企业级大模型解决方案能力,以支撑其“AllintoB”与“一把手工程”战略的落地推进。

时间:2026-05-16 11:28
MiniMax高级研究总监钟怡然半年前离职独家消息

MiniMax高级研究总监钟怡然半年前离职独家消息

MiniMax高级研究总监钟怡然半年前离职。他曾主导关键项目MiniMax-01的研发,其创新的LightningAttention架构显著提升了模型的长上下文处理效率。公司对其过往贡献表示感谢并送上祝福。

时间:2026-05-16 11:27
爱诗科技B+轮融资1亿元 ARR突破4000万美元

爱诗科技B+轮融资1亿元 ARR突破4000万美元

爱诗科技完成B+轮1亿元融资,年度经常性收入突破4000万美元。旗下PixVerse平台全球用户超一亿,月活用户达1600万,商业化后收入年增超十倍。其自研视频大模型迭代迅速,通过Agent助手降低创作门槛,并借助社交模板驱动全球增长。平台API生态发展强劲,单月调用量翻倍,推动AI视频从娱乐向产业应用升级。

时间:2026-05-16 11:27
太初元碁联合产业链伙伴推出AI落地北京方案

太初元碁联合产业链伙伴推出AI落地北京方案

在2025人工智能计算大会上,30余家企业联合发布“北京方案”,旨在通过芯片厂商、大模型公司及行业应用方的全链路协作,构建开放标准,整合国产芯片与主流大模型,夯实自主技术底座。太初元碁展示了高性能计算与AI融合的解决方案,并以案例说明AI正从认知引擎转向智能行动主体。

时间:2026-05-16 11:27
小模型崛起成为AI新战场

小模型崛起成为AI新战场

AI行业风向正从小模型转向。腾讯、阿里和OpenAI相继推出小参数模型,显示小模型重回舞台中心。如今的小模型专为终端部署设计,称为端侧智能,能在手机等设备本地运行,应用于故障预警、智能座舱等场景。凭借低算力需求和本地化优势,小模型正开辟大模型之外的新战场。

时间:2026-05-16 11:26
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程