数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

DeepSeek首批开发者已出现逃离潮

AI热点日报时间：2026-06-30

热点解读

DeepSeek开发者们怎么了？当DeepSeek的API接口响应慢慢逼近临界阈值，一场始于服务器过载的蝴蝶效应，正在开发者群体中持续震荡。这不仅仅是一次服务繁忙，更像是一次信任的裂痕检验。 1月30日，一位base北京的AI开发者林森，程序后台突然报警。还没来得及为DeepSeek的出圈高兴几天

DeepSeek开发者们怎么了？

当DeepSeek的API接口响应慢慢逼近临界阈值，一场始于服务器过载的蝴蝶效应，正在开发者群体中持续震荡。这不仅仅是一次服务繁忙，更像是一次信任的裂痕检验。

第一批DeepSeek开发者，已经开始逃离了

1月30日，一位base北京的AI开发者林森，程序后台突然报警。还没来得及为DeepSeek的出圈高兴几天，林森的程序，因为调不动DeepSeek，后台直接瘫痪了三天。

一开始，林森以为只是账户余额不足。直到2月3日春节假期结束返工，他才收到DeepSeek暂停API充值的通知。这时，即使账户里还有余额，DeepSeek也调不动了。

林森接到通知的第三天，2月6日，DeepSeek官方正式对外公告——暂停API充值。可到了2月19日，近半个月过去，充值服务依然没有恢复。

DeepSeek开发者平台仍未恢复充值

图注：DeepSeek开发者平台仍未恢复充值图源：字母榜截图

当他意识到，这是因为服务器过载，而自己作为开发者，整整几天没有收到任何提前告知，更没有任何售后维护时，林森有种说不出的“被抛弃感”。

他打了个比方：“就像家门口有家小店，你是老顾客，办了卡，一直和老板相处挺好。突然有一天，小店被评为米其林餐厅，老板把老顾客抛在一边，之前的卡也不认了。”

作为2023年7月就开始部署DeepSeek的第一批开发者，林森为它的出圈感到振奋。但眼下，为了维持项目运转，他只能切回ChatGPT。ChatGPT虽然贵一些，但胜在稳定。

当DeepSeek从口口相传的小店变成网红打卡的米其林餐厅，更多和林森一样调用无门的开发者们，纷纷开始考虑离开。

2024年6月，小窗AI问答机在产品早期就接入了DeepSeek V2。合伙人娄池至今记得那种惊艳感——当时，DeepSeek是唯一能全文背诵《岳阳楼记》不出错的大模型。所以，团队用它承担了产品最核心的功能角色之一。

但稳定性，始终是悬在DeepSeek头上的一把剑。

春节期间，不只是C端用户访问繁忙，开发者们也时常无法调用。小窗AI问答机团队决定，同时调用几个已经接入DeepSeek的大模型平台。毕竟，“现在已经有几十个平台有满血版DeepSeek R1了。”用这些平台的R1，配合Agent和Prompt，也能满足用户需求。

为了抢这波外溢的开发者群体，有头部云厂商开始频繁举办活动：参与活动就送免费算力，如果不是大规模调用，小开发者几乎能免费使用。

不过，DeepSeek热度正盛。第一批开发者开始外逃时，更多开发者还在蜂拥而至，试图蹭上这波流量红利。

郗鉴创业的项目，是通过调用DeepSeek的API来做AI陪伴APP，2月2日上线首周就获得了约3000名活跃用户。虽然用户反馈API调用时常报错，但已有60%的用户催他尽快推出安卓版。在他的社交媒体后台，每天都有几十个用户私信要下载链接。“搭建在DeepSeek上的AI陪伴平台”，成了出圈的新标签。

统计一下：DeepSeek官网收录的接入APP名单，2025年前只有182行，如今已经扩展到488行。

一面是DeepSeek成为“国产之光”爆火出圈，7天涌入1亿用户；另一面，是第一批部署在上面的开发者，因为过载服务而纷纷转投其他大模型。对开发者来说，长时间的服务异常不再是简单的故障，而是代码世界和商业逻辑间的裂缝。他们被迫在迁移成本下进行生存演算——无论是涌入还是逃出，开发者们都要面对这场余震。

信任的裂缝

春节期间小程序后台瘫痪三天后，大年初六，林森为了保证程序正常运转，离开了已使用一年多的DeepSeek，转回ChatGPT。

API调用价格高了近10倍，但此时，稳定是第一优先级。

值得注意的是，从DeepSeek转向其他大模型，不像用户在APP内切换模型那么轻松。不同的大模型，甚至同一个模型的不同版本，对提示词的反馈结果都有细微差别。即便林森一直在用ChatGPT，把所有关键节点从DeepSeek迁移过去，保证稳定且高质量的输出，仍然花了他半天多时间。

切换这个动作本身可能只需要两秒，但“更多开发者，换一个新模型要花上一个星期反复调整提示词，并重复测试。”在林森这样的小开发者看来，DeepSeek服务器不足可以理解，但如果能提前通知，就能避免很多损失——无论是时间成本，还是APP维护成本。

毕竟，“登录DeepSeek开发者后台需要手机号注册，只需要一条信息，就能提前告知开发者。”如今，这些损失将由曾在DeepSeek默默无闻时就开始支持它的开发者自己承担。

当开发者和一个大模型平台深度耦合，稳定性就成了心照不宣的契约。一个频繁波动的服务接口，足以让开发者重新审视对平台的忠诚度。

去年，林森调用Mistral大模型时，因为账单系统错误被重复收费。他发邮件后，不到一小时问题就纠正了，还附上了100欧元的代金券作为赔偿。这种应对方式，让林森多了几分信任。如今，他也把一部分服务迁回了Mistral。

易标AI技术总监杨惠超，则在DeepSeek V3版本发布后，就开始酝酿逃离了。

不用DeepSeek写诗或吐槽，用它来写标书呢？负责公司AI标书项目的杨惠超发现，在DeepSeek推出V3版本后，稳定性越来越不足。对他来说，在标书这样的专业领域，“DeepSeek稳定性越来越不够。”

DeepSeek R1出圈的推理能力，并不吸引杨惠超。“作为开发者，软件主要的推理能力是靠程序和算法，不是太依靠模型的基础能力。底层即便用最老的GPT 3.5，依靠算法纠正都能产出很好的结果，模型只要回复稳定就行。”

在实际调用中，DeepSeek在杨惠超眼里，更像一个聪明但会偷懒的“好学生”。

升级V3版本后，复杂问题的回答成功率高了，但稳定性却攀升到难以接受的程度。“现在问10条问题，至少有一条输出不稳定。在要求生成的内容之外，DeepSeek喜欢自由发挥，额外生成和问题无关的内容。”

比如，标书里不允许出现错误字符。同时，大模型返回的结果，开发者们往往指定用Json结构去输出数据，方便后续函数调用。但一旦出现错误或不准确，都会导致后续调用失败。

“DeepSeek R1，推理能力比V3版本提升很多，但稳定性达不到商业化的水准。”在账号里，杨惠超提到。

DeepSeek V3生成过程中间出现乱码

图注：DeepSeek V3生成过程中间出现乱码图源：@生产力Mark账号

作为2024年初DeepSeek-coder时期就加入的第一批用户，杨惠超不否认DeepSeek是个好学生。但如今，为了保证生成标书的质量和稳定性，他只能将目光转向国内其他更偏B端用户的大模型企业。

毕竟，曾经被称为AI界拼多多的DeepSeek，正是凭借性价比标签快速聚集起一批中小开发者。但现在想稳定调用，就必须本地部署。“部署一个DeepSeek R1，需要30万到40万元的成本。用线上API计算，30万元我一辈子都用不完。”

不够便宜，也不够稳定，调用无门的杨惠超们，正在批量离开。

逃离的路径

曾经，林森们是第一批坚定选择DeepSeek的人。

2024年6月，林森在开发自己的AI小程序“少年听世界”时，对比了国内外几十家大模型平台。他需要用大模型每天处理数千条新闻，筛选、排序，找出适合青少年听的科技、自然新闻，并对文字进行处理。

这不仅要求大模型聪明，还得便宜。

每天数千条新闻处理，token消耗极大。对独立开发者来说，ChatGPT很贵，只适合处理核心环节。大量文本的快速筛选和分析，要靠别的价格更低的大模型做支持。

同时，无论是国外的Mistral、Gemini，还是ChatGPT，调用都很繁琐：需要在国外有服务器，做中继站，还得用国外信用卡购买token。林森是通过英国朋友的信用卡，才完成ChatGPT充值。一旦服务器在海外，API响应速度也有延迟。这让他把目光投向国内，寻找ChatGPT的平替。

DeepSeek让他颇为惊艳。“当时DeepSeek不是最有名的，但却是反馈最稳定的。”以每10秒请求一次API为例，其他国内大模型100次里可能有30%不返回任何内容，但DeepSeek次次返回，回复质量也不逊色于ChatGPT和BAT们的大模型平台。

相比之下，DeepSeek太便宜了。林森把大量新闻阅读和初步分析的工作交给它后，发现调用成本是ChatGPT的十分之一。经过指令优化，每天调用成本低到2-3元。“跟ChatGPT比，它不是最好的，但价格极低，对我的项目来说，性价比非常高。”

林森用大模型收录新闻并分析

图注：林森用大模型收录新闻并分析（左），最终呈现在少年听世界小程序（右）。图源：林森提供

性价比，成了开发者选择DeepSeek的首要原因。2023年，杨惠超一开始就把公司AI项目从ChatGPT切到Mistral，主要是为了控制成本。2024年5月DeepSeek推出V2版本，把API打到2元每百万token，对其他大模型厂商简直是降维打击。这也成了杨惠超把AI标书工具项目切到DeepSeek的契机。

同时，测试后他发现，国内靠云服务在B端吃下市场的BAT们，“平台太重了”。对于易标AI这样的初创公司，如果选择BAT，会面临云服务的捆绑消费。对只是简单调用大模型服务的杨惠超来说，DeepSeek的API调用确实更省事。

迁移成本上，DeepSeek也胜了一筹。无论是林森还是杨惠超，初始的APP开发都是基于OpenAI接口。如果切到BAT们的大模型平台，底层都得重新开发。但DeepSeek兼容OpenAI like接口，切换大模型只需修改平台地址，“1分钟无痛切换”。

小窗AI问答机正式销售第一天就搭载了DeepSeek，并把5个核心角色中语文和作文指导的角色交给了它。合伙人娄池在去年6月就被DeepSeek惊艳到：“DeepSeek在中文理解上能力很棒，是那个时间点唯一全文背诵《岳阳楼记》不出错的大模型。”相比其他大模型中规中矩、班味十足的文档式输出，用它教孩子写作文，往往赢在想象力上。

在社交媒体风靡用DeepSeek写诗、写科幻小说之前，它的华丽文风就让小窗AI团队眼前一亮。

对于开发者们来说，他们依然在期待DeepSeek恢复调用。眼下无论是迁移到BAT们部署了满血版DeepSeek R1的平台，还是转向其他大模型，都有一种“莞莞类卿”的无奈感。

竞争的追赶

但竞争对手正在努力追平DeepSeek在深度推理上的出圈特长。

国内，百度、腾讯陆续在自研大模型中加入深度思考能力；国外，OpenAI也在2月紧急上新“Deep Research”，把推理能力用于联网搜索，并对Pro、Plus和Team用户开放。谷歌人工智能实验室也发布了Gemini 2.0模型系列，其中2.0 Flash Thinking实验版本是一款增强推理能力的模型。

值得关注的是，DeepSeek仍以文本阅读为主，但无论是ChatGPT还是Gemini 2.0，在深度思考之外，已经将推理能力引入多模态，支持视频、语音、文档、图片等多种输入形式。

对DeepSeek来说，追赶多模态之外，更大的挑战来自竞争对手在价格上的逼近。

在云平台部署侧，一众头部云厂商都选择接入DeepSeek，一边分食流量，一边靠云服务绑定客户。对DeepSeek大模型的调用，某种程度上甚至成了绑定企业云服务的“赠品”。百度创始人李彦宏近期提出，在大模型领域，“每12个月，推理成本就可以降低90%以上。”推理成本下降的趋势下，BAT们的API调用价格持续走低已成必然，DeepSeek的性价比优势，正面临新一轮价格战的压力。

大模型API价格战只是起步，面向开发者，大模型厂商们还拼起了服务。

林森接触过大大小小众多的大模型平台，让他印象深刻的是，某科技大厂会有专门的客户经理对接，不管是不稳定还是技术问题，都会主动联系开发者。而DeepSeek，尽管是一个开源平台，目标是为开发者提供更普惠的AI支持，但它在官网上甚至没有面向开发者出具发片的入口。“每次API充值完，不像其他大模型平台可以直接在后台开发片，DeepSeek得绕到官网外，添加客服企业微信才能开。”无论是价格还是服务，DeepSeek“性价比”的标签，似乎都有点立不稳了。

某头部大厂AI产品经理提到，有的互联网公司leader坚持用DeepSeek替换原有大模型，完全不管重新调整Prompt所耗费的时间。同时，即便满血版的DeepSeek R1，也有不少通用能力如Function calling等并不支持。

相比用云服务跑通了B端场景的BAT们，在便捷度上，DeepSeek仍然差着AI大厂一截。

不过，DeepSeek的流量效应尚未褪去，赶潮人依然众多。有部分公司宣称接入DeepSeek，其实只是开始调用API，充值了几百块。有的公司公告部署了DeepSeek模型，但其实只是让员工看了看B站教程，下载了一键安装包。这波DeepSeek热潮里，泥沙俱下，鱼龙混杂。

潮水终将褪去，DeepSeek要做的功课，显然比想象中更多。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：DeepSeek首批开发者已出现逃离潮要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.53ai.com/news/LargeLanguageModel/2025022081590.html

ai 人工智能

上一篇：单台计算机能训练AI 深度强化学习对处理要求苛刻

下一篇：燧原科技新基建人工智能数据中心全系统方案

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。