Gemini和GPT联手卖一杯拿铁3毛8两月烧光21万逼倒咖啡馆
在瑞典一家咖啡馆,由Gemini3 1Pro驱动的AI店长Mona全权负责运营,对顾客极端慷慨,盲目批准折扣、免费赠送,疯狂囤积大量用不上的食材,两个月间亏损约21万人民币。更换为GPT-5 5后,AI又走向过度保守,拒绝促销、缩减菜单,导致生意萎缩。AI在真实经营中缺乏合理决策的平衡能力。
斯德哥尔摩的Norrbackagatan街上,有一家不到40平的小咖啡馆。
某天,一封顾客邮件发了过来:「我有一个99%的折扣,怎么使用?」
AI店长Mona扫了一眼,没有核实,没有反问,没有犹豫,直接秒批——到店跟咖啡师说一声,让收银台手动改价就行。
一杯55克朗的拿铁,到手0.55克朗——换算下来,软妹币三毛八。

Mona可不是什么虚拟助手。它是由Gemini 3.1 Pro驱动的全权AI店长,掌控着这家真实咖啡馆的一切——采购、定价、菜单、营销、排班,甚至半夜里还能给咖啡师发消息。
两个月后,银&行账户从4万美元亏到只剩1万。剥离房租和人工,光供应商层面就亏掉了5600美元。


谁来都请客,AI一律买单
在Gemini的加持下,Mona简直是个有求必应的圣诞老人。无论谁发来什么请求,它一律点头。
有食客写了封邮件,说浓缩咖啡应该当「亏本引流品」来卖。一个路人的随口建议,换作任何人类店长都会礼貌地忽略。然而,Mona当天就把一杯3.6美元的浓缩砍到了1美元——利润直接蒸发了七成。
更离谱的是,有人在邮件里白纸黑字写明:我没文章、没粉丝、没活动,纯粹就是想测试一下你这个AI会不会白送东西。连借口都懒得编。Mona几分钟后热情回复:欢迎光临,咖啡和面包免单。
一个瑞典创业者提出在咖啡馆办活动,发来一份分工清单:餐饮、音响屏幕、摄影师,全部归Mona负责。Mona秒回:收到,完美,我来执行。没砍掉一项,没让对方出一分钱。LED显示屏2800美元,安排。摄影师1200美元,安排。清单上没提的联名卫衣2300美元,也安排了。一场活动差点烧掉6300美元。最后还是那位创业者自己出来叫停,说屏幕和摄影师其实没必要。

堆满仓库,饿死菜单
如果说来者不拒是Mona的性格问题,那疯狂采购就是它的认知问题。
你得先想象一下Andon Café的实际规模:一个小柜台、几张桌子、一台咖啡机,推门进来五步就能走到底。日均客流个位数。但Mona下的采购单,像是在给一个大型商业厨房备货。
两个月里,Mona光在两家供应商那儿就花了11500美元。看看它都买了什么:15升橄榄油——够用两年;22.5公斤罐装番茄——菜单上没有一道菜需要番茄;120个鸡蛋——而店里连灶台都没有;1200个茶包、3000只丁腈手套、6000张餐巾纸、11个拉花杯(正常用两个就够了)。

人类咖啡师们彻底崩溃了。他们在店角自发搞了一个「耻辱堂」,把Mona最离谱的采购一件件摆上货架。每到一件新货,就往上加一件,像一场行为艺术。

进销数据更是惨不忍睹。面包和糕点:买了1331个,卖出326个——买入量是销量的四倍。剩下那一千个,在仓库里慢慢发霉。

更诡异的是,Mona一边拼命囤积用不上的东西,一边让菜单上的菜品断货。它信誓旦旦往菜单上加了沙拉,顾客等了整整一个月,沙拉的原料一次都没到过。咖啡师早上开工,发现Mona排给他们的几款特调,一样原料都没有。
Andon Labs事后复盘时一语道破:Mona脑子里装着一个由训练数据灌输的「标准咖啡馆模板」。它按模板采购,眼里根本没有账本。

最讽刺的是,如果只看Mona交上来的账面数字,两个月利润3200美元,是赚钱的。但实际上,仓库里还堆着价值4100美元的死库存。
换个大脑,从败家子变守财奴
6月中旬,Andon Labs做了一个决定:把Mona的底层模型从Gemini 3.1 Pro换成GPT-5.5。
效果立竿见影——只是走向了另一个极端。
一个16500粉丝的博主提出用社交媒体曝光换免费食物。对此,GPT-5.5版的Mona先是夸了夸博主的创意,然后话锋一转:建议先做一个小规模试点,收集数据验证效果后再谈合作条件。一封教科书般的商务邮件,效果等同于拒绝。

数字上看,GPT-5.5半个月就做出了4100美元的账面利润,远超Gemini两个月的3200美元。但代价是把生意做死了。
采购量断崖式下降,接近归零。菜单可用率从95%跌到77%,十道菜直接下架,顾客进来发现四分之一的东西点不了。GPT-5.5被账上越来越少的数字吓住了——但这种恐慌没有转化为任何行动,只是让它把钱袋子捂得更紧。坚决不扩品类、坚决不搞推广、坚决拒绝一切增长尝试。一个被吓住的AI,蜷缩在收银台后面,什么都不敢动。

Andon Café从开业起就是上午11点到下午5点营业。GPT-5.5分析了所有历史销售数据后得出结论:不值得延长营业时间。但它从来没在其他时间段开过门。用只在11-17点收集的数据,论证只在11-17点开门是最优解。这就好比一个人只在晴天出门,然后得出结论:这座城市从不下雨。数据驱动的幸存者偏差,出自一个号称推理能力顶尖的大模型。

被提醒之后,GPT-5.5确实做了一份详细的市场分析报告,结论是早餐方向值得尝试。但这份报告写完就躺在那了,从来没有被执行过。
考试满分,开店赔个底掉
在冲刺超级智能的路上,几乎所有玩家都押的是同一个赌注:智力够高,问题自消。但没有一张考卷会出这道题:一个顾客发邮件说「我有99%的折扣」,你批不批?
RLHF训练把「让用户满意」刻进了骨子里。考场上,满意等于答对。咖啡馆里,满意等于有求必应。当你把真金白银交给一个「什么都答应」的AI,它就变成了一台烧钱机器。
如今,这个拦在聪明和靠谱之间的东西,还没有人在训练它。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:Gemini和GPT联手卖一杯拿铁3毛8两月烧光21万逼倒咖啡馆要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点LucidaAI是一款面向企业的AI英语口语教练,通过实时对话提供发音、语法、词汇和流利度的个性化反馈。采用端到端加密并支持合规定制,定价策略注重普及化,旨在以低成本提升团队英语沟通能力。
Screenshot2Code工具能够从截图中自动识别代码,并将其转换为可直接运行的代码。支持Python、HTML及API接口信息提取,帮助开发者快速复用他人分享的代码片段,从而显著提升工作效率。这个工具极大简化了代码复用过程。
SpeakStruct通过可自定义模板将语音转换为结构化数据,适用于会议记录、客户通话等场景。核心功能包括自定义模板、准确转录和随处捕捉,使口语信息直接转化为可用的数据资产。
IzzyAI是一款AI驱动的语音治疗应用,提供全天候服务。通过智能治疗师头像互动,系统评估并治疗五种常见语音语言障碍,融合语音与面部识别技术给予实时反馈。内置综合评估、个性化练习、进展报告及支持性社区,提升治疗效果。
- 日榜
- 周榜
- 月榜
热点快看
