押注智能化的确定性,火山引擎做对了什么?

斯坦利·库布里克执导的科幻电影《2001:太空漫游》中,飞船上拥有红色镜头和冷静嗓音的主控电脑哈尔9000,构成了旧时代AI的终极隐喻:一个孤立的、中心化的、封闭的智能体。
从冷静报告AE-35组件故障,到面不改色将船员一一置于死地,哈尔的叛变并非简单的系统错误,而是困于两套冲突的底层指令,最终选择用谋杀保全任务。
这揭示了一个残酷的真相:仅有智商没有情商,缺乏持续学习和反馈能力的AI,在现实规则面前,极易走向理性的反面。
真实世界中,人工智能没有延续哈尔的阴影,在产业界的落地过程中,AI不是控制飞船的“唯一大脑”,定位更接近各行各业的“智能外脑”。
几年前ChatGPT横空出世带给产业界的是无以复加的震撼,在AI加速落地的当下,产业界对智能化的追逐已经成为共识,AI正在一个个真实的业务和场景里快速渗透。
按照IDC的数据,今年上半年,中国大模型公有云服务Tokens调用总量达到536.7万亿次。其中,火山引擎份额超过49%,位列第一。截至12月,豆包大模型日均Tokens调用量高达50万亿次,仅次于OpenAI和Google。
在2025冬季FORCE原动力大会上,火山引擎总裁谭待给出了一个清晰的定调:传统的IT架构已经无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成。
AI云原生架构中,模型是软件的核心,MaaS是使用模型的最佳方式,而算力以Tokens的方式转换为智能。

如果算力是人工智能时代的电力,那么Tokens的调用就是人工智能时代的用电量,是衡量产业界应用AI服务几乎最精确的指标。
作为这个时代的火力发电厂,云计算行业的竞争格局也在深度重构。
一道必答题
前段时间,以准确预测2008年次贷危机闻名的“大空头”Michael Burry把矛头对准了AI行业,对着高科技公司望而生畏的资本开支阴阳怪气:只要你宣布在AI上增加1美元的资本开支,你的市值就能因此增加3美元。
这番话的背景是美国科技公司集体刷新资本开支指引,谷歌上调80亿美元,Meta上调40亿美元,行业整体支出超过2000亿美元。
但Michael Burry的嘲讽精确的点出了资本市场升腾的疑虑:大公司不计代价堆砌算力,对应的需求到底有多少?又创造了多少商业价值?

美国科技巨头的投资金额创纪录
作为被点名者,Meta CEO扎克伯格第一时间反唇相讥[2]:我宁愿烧光几千亿美元,也不愿冒着落后的风险。
扎克伯格虽然没有直接回应问题,但真实的反映了巨头们的焦虑。对高科技公司而言,在人工智能时代,投入不足的风险恐怕远高于投入过度,大家只能硬着头皮上。
庞大的资本开支和潜在AI收益之间的巨大鸿沟,既是资本市场为企业定价时面对的分歧,也是产业界面对的真实的不确定性。
2022年底ChatGPT横空出世,在斩获“蒸汽机时刻”、“iPhone时刻”等一连串惊悚标签的同时,也把一众以英伟达为代表的半导体公司送上了神坛。全球范围内掀起生成式AI热潮,但在落地环节缺少了些回肠荡气,多了些摇摆不定。
一方面,产业界对智能化转型早已形成共识,智能化不是一道是否要做的选择题,而是关乎生存与未来的必答题。
尤其当算力的需求结构重心从训练转向推理,Token调用量快速增加,意味着AI进入到“实战”环节,用户体验成为衡量产品竞争力的核心论据。
但另一方面,对企业来说,智能化投资难以形成一个清晰量化的预期回报,有多大决心就多大的心理包袱。
按照谭待的说法,火山引擎通过从模型能力到基础设施的全方位革新,正在推动AI应用从单一模型调用转向Agent智能体生态,为的就是加快提高各行各业的“AI含量”。
人工智能领域沸腾的资本开支,产业界转型重担加上并不明朗的回报率,是留给云服务商的一道复杂考题。
卖算力or卖Tokens
今年11月,谷歌新一代Gemini 3模型炸场前夕,xAI出其不意发布最新版本Grok 4.1模型,率先登顶大模型竞技场榜单LMArena。这距离Grok-3发布仅过去9个月。
这场低调的抢跑透露出一个信号:大模型的参赛门槛已经越来越高。
谷歌云副总裁Amin Vahdat曾在誓师大会上动员大家加把劲:谷歌必须每6个月将训练算力翻一番,才能满足AI市场的需求。
推理侧也是如此,一次调用Token的长度越来越长,会消耗更多算力。换句话说,模型领先的成本是以持续性支出作为计算基础,并非所有公司都能负担得起。
出于成本和效率的双重考量,云服务商的商业模式也在经历重大变革:从“卖算力”过渡到“卖Tokens”(MaaS模式),本质是从“卖生产资料”转向“卖生产力”。
“Token”可以理解为一个词或词片段,相当于大模型消化和生成文本的乐高积木,它真实而具体的衡量了一家企业对智能化产品的“使用量”。

和卖算力的IaaS模式相比,Maas模式意味着终端客户可以直接调用模型的核心能力,比如文本生成、交互应答。与此同时,还能节省下开发和维护底层基建的成本。
另一方面,IaaS、PaaS等模式,其诞生的背景离不开在移动互联网产业轰轰烈烈的增长年代。在AI云原生架构中,开发者通过API调用模型能力,Tokens能够精确反映Agent和模型的使用成本,也是更务实的计费和资源度量单位。
从产业价值看,MaaS模式和IaaS模式也有本质区别。相比算力的销售额,Token的消耗量更接近AI产业景气度的“晴雨表”,原因有三点:
首先,算力可以闲置,但Token的调用量反映了模型推理过程中的计算量。换句话说,它和AI应用的实际落地情况紧密相关。而且MaaS模式是按Token的调用量收费,丰俭由人。好用的模型往往调用量更高。
按照火山引擎披露的数据,一家消费电子行业客户引入视觉理解模型后,Token消耗量在5个月里增长了12倍。火山引擎总裁谭待透露,目前已有超过100家企业客户Token使用量超过一万亿。
其次,算力的销售更像一次性买卖,Tokens反而更具备可持续性。前者提供的是“用完即走”的服务,后者会基于反馈不断优化打磨底层模型能力,进而提高自身的生态护城河。
最后,MaaS模式大幅提升了模型规模化落地的效率,增长潜力远超传统IaaS模式。按照毕马威的说法[3],Maas模式将成为通用人工智能(AGI)生态构建的核心。
“Tokens经济”不仅是一种计费形式,它更像驱动整个AI产业正向循环的一双手。对企业来说,它意味着投入产出比可以更加清晰量化的观测;而对云服务商来说,承接了多少Tokens的调用,也更贴近市场竞争中真实的含金量。
从汽车到消费电子,从金融到教育,越来越多的行业接受并融入火山引擎的Maas模式,并不是一场意外。
为什么是火山引擎
若论对智能化转型的迫切程度和执行力度,汽车行业可谓当仁不让。
汽车工业是机械电子、材料、软件通信等众多垂直产业的集大成者,一直是生产制造自动化的忠实拥趸。新能源车普及后,多变的市场需求、快速的技术更替,让百年历史的汽车工业又成为了智能化的特区。
时至今日,火山引擎已经覆盖了90%的主流车企。今年,豆包大模型更在规模落地上取得关键进展,成为中国市场智能座舱搭载量第一的AI模型。
从特斯拉领头的新势力,到一汽、长安等老牌车企,再到奔驰、宝马、奥迪、大众等海外品牌,豆包大模型已经成为AI汽车的标配项。

奔驰纯电CLA等众多新车接入豆包大模型
接入豆包大模型后,车机体验的提升非常直观。相较于传统汽车通过规范指令控车,豆包大模型让用户可以随意下达模糊指令,实现复杂的车控能力。车机整合大模型联网搜索和深度思考后,还能直接制定出行规划、定位车辆故障等。
在荣威M7 DMH上,车机可以准确理解用户模糊的表述,攻克山东人的倒装句式不在话下。即便多人同说,车机也能精准区分进行回答。而奔驰纯电CLA交互效率比上代车型提升50%,唤醒速度快至0.2秒,还能识别说话人的感情,提供相应的反馈。
在大规模走向产业界之前,火山引擎的模型能力首先在字节跳动内部庞大的业务体系内完成了演练实操。正所谓自己做的降落伞自己先跳,包括抖音、今日头条、番茄小说等50多个业务,都先于外界应用了豆包大模型。
时至今日,火山引擎豆包大模型已广泛应用于手机、汽车、教育、消费等行业,从多方面助力各行各业智能化升级。
在智能助手方面,基于火山引擎HiAgent智能体开发工作站,海底捞打造了AI用餐管家”小捞捞”,为消费者缩减了30%预定操作时间;
博西家电的“西西子”为用户提供智能导购、家电管家、售后服务等在线交互服务;瑞幸咖啡的AI点单助手实现“动动嘴就能点咖啡”;
中免日上的智能导购,可以根据用户肤质、肤色、个性化需求智能推荐合适的产品。
Agent正深入各行各业的各个场景中,手机可谓端侧落地Agent的试金石。OPPO、vivo、荣耀、三星等基于豆包大模型,升级AI原生体验,包括多模态识物、智能创作、联网实时问答....让手机智能化功能实现跃迁。
在豆包大模型的加持下,智能助手具备持续学习的能力,可以结合反馈不断优化,做到“越用越懂用户”。
在精准营销和运营方面,赛力斯联合火山引擎创建了用户之声管理平台(VOC/Voice of Customers)。依托豆包大模型的理解、分类和总结能力,准确推测用户情绪,并将反馈迅速提炼,提高业务团队的决策效率。
极氪则引入部署火山引擎Data Agent数据产品,内部对数据的需求从提出到完成分析可以分钟级别实现,打破了过去数据获取链路冗长、全流程效率不足的挑战。
当新车迭代节奏向消费电子看齐,这一代产品刚刚落地,下一轮变革悄然开始,每一个有效的数据和用户反馈都是车企的核心资产,代表新车可以提前试探市场的水温。
对连锁品牌而言,出品和服务品质不被门店规模稀释,可谓经营环节最复杂的问题。在智能巡检方面,火山引擎助力喜茶、库迪等连锁品牌,实现了统一、自动化的质量管理,让消费者无论走进哪家门店,都能体验到高品质和规范化的服务。
从汽车到电子,从餐饮到消费,各行各业之间的业务场景千差万别,但在“智能化”上的诉求是一样的:通过大模型和Tokens的调用,让分散的非结构化数据变成业务和技术语言,实现产品体验和经营效率的提高。
不同行业间的流程与方法千差万别,但在获客、销售、售后服务等环节,行业间的相似性远远大于差异性。火山引擎AI Agent的优势,恰恰在于对各个环节的适配,可以达到跨行业的通用性。
同时,基于Tokens的计费和资源度量,也让企业的投入产出比可以更加直观的呈现。在群狼环伺、市场瞬息万变的竞争环境里,这无疑是一种兼具敏捷性与确定性的战略选择。
把晦涩枯燥的技术语言转化为可以度量的效率和速度,是MaaS模式的优势所在,也是人工智能落地阶段最核心的竞争力。
在更广阔的产业界,AI的参数量还在以指数级扩张、应用场景还在以难以预测的方式涌现,每一次Token的调用,都是人工智能融入产业的一个脚印。作为这个时代新的景气度指标和晴雨表,Tokens调用量背后的含金量,会越来越高。
而当“AI+”成为时代性命题,如何走向智能化的未来,目标已经清晰,路径的共识也许还在凝聚。火山引擎之于千行百业的意义,恐怕也会越来越深刻。

参考资料
[1]AI is creating new billionaires at a record pace,CNBC
[2]I’d Rather “Misspend” Billions Than Lose the AI Race: Why Going All-In Makes Sense,Medium
[3]人工智能全域变革图景展望:跃迁点来临(2023),毕马威
作者:徐珊珊
编辑:李墨天
责任编辑:徐珊珊
封面图片来自ShotDeck
相关推荐
从 Others 到挑战者第一,火山引擎没有错过大模型
字节跳动的ToB生意,为什么需要火山引擎?
对话火山引擎谭待:多数人低估了火山拿下 AI 云的决心
火山引擎战略初现,字节跳动打造To B服务双引擎?
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
AI从科学到商业,火山引擎的少数派答案
第三季度中国市场收入猛涨70%,Tiffany做对了什么?
火山引擎发布自研视频编解码芯片
字节跳动推出企业技术服务平台“火山引擎 ”
资本的确定性和市场的不确定性下,新造车迎来“决胜局”
网址: 押注智能化的确定性,火山引擎做对了什么? http://www.xishuta.com/newsview145461.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
