最近的信号:企业开始给 AI 消耗设边界
7 月 1 日,Business Insider 报道了 UBS 对企业 AI 支出的观察:越来越多公司开始关注 AI 使用中的 token 消耗,并通过用量限制、模型选择和审批机制来控制支出。报道里的一个关键信号是,企业并不是简单放弃 AI,而是在尝试把“无限试用”转为“有边界地规模化使用”。
6 月底,关于企业控制 AI 成本的讨论也明显增多。华尔街日报在 6 月 30 日报道中提到,一些企业开始借鉴云计算时代的 FinOps 方法,用监控面板、支出上限、showback 和 chargeback 等方式管理 AI token 支出。原因并不难理解:在早期试点阶段,一个团队、一个部门、一个演示项目的成本容易被忽略;但当 AI 嵌入真实业务流程后,调用量会随着员工规模、客户请求、自动化任务和 Agent 链路快速放大。
与此同时,学术研究也在提醒企业,AI 成本不能只看单次问答价格。
6 月 10 日,一篇题为《AI Tokenomics: The Economics of Tokens, Computation, and Pricing in Foundation Models》的论文提出,token 已经成为连接信息处理、计算、内存、能耗、定价和经济价值的基础计量单位。论文的核心价值在于,它把 AI 成本从“模型价格表”扩展为一套经营问题:哪些场景值得用更强模型,哪些场景应该用轻量模型,哪些任务因为上下文过长或反复调用而变得不经济。
另一篇 4 月发布、4 月 29 日修订的研究《How Do AI Agents Spend Your Money?》则从 AI Agent 角度指出,Agent 型任务的 token 消耗高度波动,输入 token 是主要成本来源,而且更高消耗并不必然带来更高准确率。企业如果只计算“调用一次模型多少钱”,很容易低估 Agent 进入生产后的真实消耗。
这些信息共同指向一个变化:企业 AI 的竞争不再只是“谁更早接入模型”,而是“谁能把 AI 使用变成可度量、可分层、可优化的运营能力”。
AI 成本失控,通常不是因为员工用太多
很多管理者听到 AI 成本治理,第一反应是限制员工使用次数。这种做法短期有效,但容易误伤真正有价值的场景。
企业 AI 成本上升,通常不是因为员工“多问了几个问题”,而是因为以下几个问题没有被管理:
第一,所有任务都调用同一种高规格模型。
摘要、分类、格式转换、内部制度查询、复杂方案推理、代码生成、合同条款分析,本来应该使用不同能力等级的模型。如果企业没有模型路由机制,简单任务也会消耗高成本资源。
第二,上下文越来越长,却没有知识检索和压缩策略。
很多 AI 系统为了“让模型知道更多”,不断把长文档、历史对话、客户资料和制度内容塞进上下文。这样做短期方便,但长期会显著增加 token 消耗,也增加过期信息、无关信息干扰答案的概率。
第三,Agent 自动执行时缺少停止条件。
Agent 一旦进入多步骤任务,可能会查询系统、调用工具、生成中间结果、再次验证、重新规划。如果没有任务边界、失败次数、预算上限和人工升级规则,成本会在后台持续发生,而业务团队未必能及时感知。
第四,企业只统计调用成本,没有统计业务收益。
如果只看 AI 账单,所有使用都是成本;如果能把 AI 使用与节省的工时、缩短的交付周期、提升的转化率、减少的返工、降低的服务等待时间关联起来,管理层才能判断哪些场景应该扩大,哪些场景应该收缩。
第五,试点成功后没有重新设计流程。
不少企业在试点阶段证明 AI “能做”,但上线后仍沿用原来的人工流程。结果是 AI 多了一层成本,却没有真正减少等待、重复录入、人工分发和跨部门确认。这类项目看上去使用量很高,ROI 却并不清楚。
企业需要建立 AI FinOps,而不是只做预算审批
云计算普及后,企业逐渐形成了 FinOps 思维:技术团队、业务团队和财务团队共同管理云资源使用,让成本、性能和业务价值保持动态平衡。
AI 也需要类似机制。
但 AI FinOps 不能只是把账单拆给各部门。它至少需要回答五个问题:
一是场景是否分级。
企业应把 AI 使用场景分成基础辅助、专业增强、流程自动化和高风险决策支持几类。不同等级对应不同模型、不同权限、不同复核要求和不同预算口径。
二是模型是否可路由。
不是所有任务都需要最强模型。企业应该根据任务复杂度、风险等级、响应速度、成本上限和结果质量要求,建立模型选择策略。简单任务优先使用低成本模型或规则系统,复杂任务再调用高能力模型。
三是上下文是否可治理。
真正成熟的 AI 系统,不是把所有资料都塞给模型,而是先检索、过滤、排序、压缩,再把必要信息交给模型。知识库质量、文档版本、权限边界和引用来源,都会直接影响成本和答案质量。
四是 Agent 是否有预算和停止规则。
企业需要给自动化任务设置最大调用次数、最大 token 消耗、失败重试次数、异常升级条件和人工确认节点。否则,Agent 越“自主”,越可能在不可见处制造成本和风险。
五是 ROI 是否按业务结果衡量。
AI 项目不能只汇报使用次数、生成字数和调用量。更有价值的指标包括:客服平均处理时长是否下降,销售方案准备时间是否缩短,研发缺陷修复周期是否改善,财务对账返工是否减少,人力政策咨询是否减少人工转接,管理报告是否更快生成并被采用。
这些指标能帮助企业区分两类 AI 使用:一种只是新鲜感驱动的高消耗,另一种是真正进入流程、减少摩擦、释放产能的有效投入。
成本治理不是财务部门一个人的事
AI 成本治理很容易被误解为财务部门的控制动作。但在企业内部,它必须是技术、业务、财务、法务和管理层共同完成的运营设计。
技术团队需要负责模型路由、缓存、检索增强、日志追踪、权限控制和系统稳定性。
业务团队需要定义哪些流程值得 AI 介入,哪些结果算成功,哪些异常必须升级。
财务团队需要把 AI 消耗从统一费用拆解到业务单元、项目、场景和流程结果上,避免只有总账没有经营分析。
法务和合规团队需要定义哪些数据不能输入、哪些输出不能直接外发、哪些高风险任务必须保留人工责任。
管理层则需要决定:企业希望 AI 优先优化什么,是缩短交付周期、提高服务质量、降低重复劳动、提升销售转化,还是增强研发效率。目标不同,成本治理方式也不同。
如果没有这层共识,企业很容易走向两个极端:要么放任使用,账单上涨后突然收紧;要么一开始就严控调用,导致员工和团队不愿意把 AI 放进真实工作。
更好的做法,是把 AI 当成一种新的生产资源来管理。它既不是免费工具,也不是纯粹成本项,而是一种需要被配置、调度、监控和复盘的能力。
对正在推进 AI 落地的企业,建议先做四件事
第一,建立 AI 使用台账。
不要只看供应商账单,而要按部门、场景、任务类型、模型、调用量、token 消耗、成功率、人工复核率和业务结果进行记录。没有台账,就没有优化。
第二,选择 3 到 5 个高价值流程做 ROI 闭环。
企业不必一开始覆盖全部场景。更实际的路径,是选择客服工单、销售方案、研发代码评审、财务报表分析、人力制度问答等高频流程,建立从调用成本到业务收益的完整复盘。
第三,为不同任务设计模型和权限策略。
简单任务用轻量方案,复杂任务用高能力模型;低风险任务允许自动化,高风险任务保留人工确认;公共知识可以更开放,敏感数据必须受权限和审计约束。
第四,把成本指标纳入 AI 项目验收。
验收不应只问“效果好不好”,还应问“单位任务成本是多少”“结果采用率是多少”“人工返工减少多少”“异常升级是否及时”“随着规模扩大,成本曲线是否可接受”。
这四件事做起来并不复杂,但它们能帮助企业避免一个常见误区:只在 AI 项目启动时讨论预算,却在 AI 真正进入生产后缺少运行管理。
一个现实判断
企业 AI 的下一阶段,不会是“无限调用换增长”,也不会是“严格限额保预算”。真正可持续的路径,是在业务价值和运行成本之间建立动态平衡。
如果企业不能看清 AI 消耗发生在哪里,就很难判断该扩大还是收缩;如果企业不能把 AI 使用和业务结果关联起来,就会在账单上涨时失去信心;如果企业不能给 Agent 和自动化任务设定边界,规模化反而会放大不可控成本。
反过来,如果企业能把 AI 成本治理、模型路由、知识治理和业务 ROI 放在同一张运营图上,AI 就不只是一个“更聪明的工具”,而会成为一套可以持续优化的生产系统。
未来真正有竞争力的企业,不一定是 AI 用得最多的企业,而是能清楚知道每一次 AI 调用为什么发生、值不值得、如何改进的企业。
这才是企业级 AI 从试点走向规模化的关键一步。