首页 科技快讯 AI 的「成本」,正在把所有人都拖下水

AI 的「成本」,正在把所有人都拖下水

来源:晰数塔互联网快讯 时间:2025年08月05日 22:24

想象一下,你开了家 AI 公司,心里清楚得很:用户最多只肯掏 20 美元一个月。

行,你心想,这不就是风投圈的经典剧本嘛——先亏本赚吆喝,用利润换增长。你也把什么获客成本、用户终身价值之类的黑话算得明明白白。

但好戏登场了:你肯定看过那张刷屏的 a16z 神图,说大模型的成本正以每年 10 倍的速度跳水。

于是你盘算着:今年我 20 美元/月能打平,等明年模型便宜 10 倍,Boom!90% 的利润率到手。亏损只是暂时的,盈利是必然的。

这套算盘,简单到刚入行的投资经理都能一眼看懂:

这策略听着没毛病:“大模型推理成本每半年降 3 倍,我们死不了。”

然而 18 个月过去了,利润率还是负得触目惊心……有些公司已经倒闭清算,连 Anthropic(Claude 的公司)本周都不得不撤回了他们最初那个“200 美元/月不限量”的旗舰套餐。

所有公司,依旧在流血。

模型的确变便宜了——GPT-3.5 的价格只有过去的十分之一。但不知怎的,利润反而更差了。

事情不对劲了,对吧?

01 没人想要昨天的报纸

GPT-3.5 是便宜了 10 倍。但它现在的吸引力,就像在 iPhone 15 发布会现场兜售诺基亚

当一个新模型顶着“地表最强”(SOTA)的光环发布时,99% 的需求会瞬间涌向它。用户对他们付费的产品,也是同样的期待。

现在,我们来看看那些“地表最强”模型——也就是在任何时间点都占据 99% 需求的模型的真实定价历史:

发现什么了吗?

当 GPT-4 以 60 美元的“天价”发布时,尽管上一代王者 GPT-3.5 已经便宜了 26 倍,但所有人还是扑向了 GPT-4。

当 Claude 3 Opus 以同样的价格登场时,即便 GPT-4 已经降价,人们还是纷纷“叛逃”。

所谓的“成本下降 10 倍”是真的,但仅限于那些跟“小霸王学习机”一个年代感的旧模型。

所以,“成本会下降”这个策略的第一个支柱就塌了:市场的需求永远只追逐“当下最好的那款模型”。而最好的模型,价格永远都差不多,因为它就代表了今天顶尖算力所能达到的成本极限。

这就像指着一辆 95 年的老本田说“这车现在真便宜!”,完全没抓住重点。是,那辆特定的车是便宜了。但 2025 款的丰田凯美瑞,建议零售价还是 3 万美元。

当你花时间与一个 AI 相处时——无论是编程、写作还是思考——你总是本能地追求最高质量。没人会打开 Claude 然后想:“要不……我换个烂点的版本,帮老板省点钱?”

我们是认知上的“贪婪”生物。我们想要能搞到手的最好的“大脑”,尤其是在天平的另一端是我们自己宝贵的时间。

02 模型的“胃口”,比我们想的要大得多

“好吧,那也还能接受,对吧?我们永远保持收支平衡不就行了?”

呵,少年,你还是太天真了。

虽然每一代顶尖模型的“单价”(per token)没有变得更贵,但另一件更可怕的事情发生了。

它们消耗的“算力单位”(token)数量,发生了核爆炸。

过去,你问 ChatGPT 一个问题,它回你一句话。现在,一个“深度研究”任务,它会花 3 分钟做计划,20 分钟阅读资料,再花 5 分钟为你重写报告。而最新的 Claude 3 Opus,你跟它说句“你好”,它都能自己“思考”上 20 分钟。

模型的进化,带来了一个谁也没预料到的结果:AI 能完成的任务的“长度”,每六个月就翻一番。过去返回 1000 个 token 的任务,现在能返回 10 万个。

把这个趋势推演下去,数学模型会变得相当疯狂:

今天,一个 20 分钟的“深度研究”任务成本大约是 1 美元。到 2027 年,我们将拥有可以连续运行 24 小时而“不掉线”的智能体(Agent)……再结合顶尖模型那雷打不动的价格?

这意味着,一个用户,一天,光是一个任务,就要花掉 72 美元。而且,你还能同时开好几个。

一旦我们能部署这种可以异步运行 24 小时的智能体,我们就不会只给它一个指令然后傻等。我们会成批地下达任务。整个“AI 工人大军”会并行解决问题,烧起 token 来,就像烧柴火一样。

显而易见——我必须强调这一点——每月 20 美元的订阅费,连一个用户每天跑一次 1 美元的“深度研究”任务都撑不住。但这恰恰是我们正在狂奔的方向。模型能力的每一次提升,都意味着它们能有意义地、在同一时间消耗掉更多算力。

这就像你费老大劲儿,造了个更省油的发动机,结果转头就用它去驱动一辆巨无霸卡车。没错,每加仑油是能跑更远了,但你现在要用掉比以前多 50 倍的油。

这就是那个把无数 AI 公司逼入绝境的“成本陷阱”——任何采用“固定月费 + 高强度算力消耗”商业模式的创业公司,都感觉自己正被人用枪指着脑袋。

03 Anthropic 的悲壮尝试

Claude那个“不限量”套餐的实验,是我们见过应对这场风暴的最精妙尝试。他们几乎用尽了所有招数,但最终还是被碾得粉碎。

他们的剧本,说实话非常聪明:

尽管有这么多天才的工程设计,token 的消耗量还是如超新星爆发一般。

一百亿个 tokens。一个月。

这相当于一个人在一个月里读了 125 万遍《战争与和平》。

怎么做到的?即便是连续跑 10-20 分钟的任务,怎么能消耗掉这么多?

事实证明,10-20 分钟的连续运行,刚好足够让用户发现“for 循环”的妙用。一旦 token 的消耗与用户在屏幕前的时间脱钩,物理定律就开始接管一切了。

让 Claude 执行一个任务,检查自己的工作,重构,优化,再来一遍……直到公司破产。

用户在一夜之间,从聊天者变成了 API 的指挥官,在 Anthropic 的服务器上 7x24 小时地跑着代码转换引擎。从聊天到智能体(Agent)的进化,一夜之间就完成了。消耗量暴增 1000 倍。这不是渐变,是相变。

所以 Anthropic 撤回了“不限量”。他们本可以试试 2000 美元/月,但教训不在于他们收费不够高,而在于:

在这个新世界里,任何订阅制的“固定价格”,都无法承载“不限量”的使用。

这盘数,已经从根本上算不通了。

04 所有人的“囚徒困境”

这就把其他所有人都推到了一个绝境。

每家 AI 公司都知道,按使用量计费能救命。他们也知道,这会要了他们的命。当你老老实实地按 $0.01/1k tokens 收费时,你那被风投喂饱的竞争对手,正用 20 美元/月“不限量”的口号抢走你所有用户。

猜猜用户会去哪?

经典的囚徒困境:

所以,每个人都选择了“背叛”。每个人都在补贴那些“超级用户”。每个人都在画着那条漂亮的“曲棍球杆式”增长曲线。每个人也最终都会发布那篇“关于定价的重要更新”的公告。

那些头部的 AI 编程公司,他们都懂这笔账。他们选择了要今天的增长,明天的利润,以及未来的破产——但那是下一任 CEO 要头疼的事。

说实话?这可能是对的。在圈地运动中,市场份额比利润率更重要。只要 VC 们还愿意继续开支票来掩盖这糟糕的单位经济模型……

不信?去问问 Jasper(曾经的 AI 写作独角兽),当音乐停止时会发生什么。

05 如何逃离这场“死亡挤压”?

难道就真的无路可逃了吗?

有三 条路可走:

1. 从第一天起就按使用量计费

没有补贴,没有“先圈人后变现”,只有诚实的经济模型。理论上很美。

但现实是,你找一个正在爆发式增长的、面向消费者的、按量计费的 AI 公司给我看看?消费者讨厌计价器。他们宁愿为“无限”多付钱,也不愿收到一张意料之外的账单。所有成功的消费者订阅服务——Netflix、Spotify、ChatGPT——都是固定费率。计价器一开,增长就死。

2. 用超高的“转换成本”来锁定高利润

这就是 Devin(那个爆火的 AI 程序员)正在赌的。他们最近宣布了与花旗和高盛的合作,向这两家公司的数万名软件工程师部署 Devin。

问个问题:你宁愿从高盛那里拿到 1000 万美元的年收入,还是从 50 万个开发者那里拿到 5 亿美元?

答案显而易见:那 1000 万美元意味着长达六个月的部署、合规审查、安全审计和采购地狱。这种合同极难赢得——但一旦赢了,就几乎不可能流失。

当竞争对手出现时,你已经深深地嵌入了对方的官僚体系中,换掉你的成本高到让 CFO 宁愿去死。因为转换成本足够高,客户对价格也就不那么敏感了,这才能带来 80-90% 的惊人利润。

3. 垂直整合:在基础设施上赚钱

这是 Replit 的玩法:把 AI 编程助手和应用托管、数据库管理、部署监控等服务打包在一起。我在每个 token 上都亏钱,但我从新一代开发者使用的其他所有服务层上把钱赚回来。

把 AI 当作“钩子”,用来拉动其他能跟 AWS 竞争的服务的消费。 你卖的不是 AI 算力,你卖的是算力之外的一切。AI 只是你的市场营销费用。

这招的绝妙之处在于,代码生成天然地会创造对托管、数据库、监控的需求。让 OpenAI 和 Anthropic 去把 AI 算力的价格卷到零吧,你拥有了除此之外的一切。

至于那些还在玩“固定费率、不惜一切代价增长”游戏的公司?

他们是行尸走肉。只是葬礼定在了今年第四季度,而且会办得非常风光。

06 前路何方

我总能看到创始人们指着那句“明年的模型会便宜 10 倍!”的口号,仿佛抓住了救命稻草。

是啊,没错。

但你的用户,会对它有 20 倍的期待。

终点线,正在以比你奔跑更快的速度远离你。

即使是像 Anthropic 这样拥有全球最顶级应用层的公司,也无法让“固定月费+不限量使用”的模式运转下去。

虽然“早起的鸟儿有虫吃”这句老话没错,但如果你只是起得早,却没有任何计划,那你也只是第一个赶到墓地而已。

这个世界,不会再有谷歌开出 24 亿美元的支票来收购一个负利润的公司了。当你的云服务账单已经超过了你的总收入时,根本不存在“以后再想办法”这回事。

那么,在这个世界里,你到底该如何建立一家公司?

答案,或许是成为一个“新云商”(Neocloud)——但这是后话了。

不过,至少,明年的模型,确实会便宜 10 倍的。:)

本文编译自 Hacking News 热榜文章《tokens are getting more expensive》。

原文链接:https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

本文来自微信公众号“AI科技大本营”,作者:Ethan Ding,编辑:王启隆,36氪经授权发布。

相关推荐

原本以为被打的是Redmi,没想到啊没想到,一加把iQOO拖下水了……
AI不应该把所有桌子都掀了
“这个赛道价值2.8万亿,但所有人都把它当痰盂”
所有人都在学的山姆,没有秘密
英伟达暴涨8%!黄仁勋安抚市场:AI芯片抢购潮还在继续,所有人都指望我们
AI伪造的苦难,正在剿杀人们的善意
聊聊私域流量:当所有人都觉得它好的时候,往往就是最危险的时候
通信、算力再次升空,6G渐近,龙年牛市所有人都赶得上
加密货币寒冬来临:底部未现,多类公司股价被“拖下水”
AI正在革新天气预报

网址: AI 的「成本」,正在把所有人都拖下水 http://www.xishuta.com/newsview139980.html

推荐科技快讯