企业 AI 开始进入成本治理阶段：不是少用，而是把每一次调用变成可管理的投入

过去两年，很多企业推进生成式 AI 的逻辑很直接：先让员工用起来，先把场景跑起来，先证明 AI 能不能提高效率。

最近的信号：企业开始给 AI 消耗设边界

7 月 1 日，Business Insider 报道了 UBS 对企业 AI 支出的观察：越来越多公司开始关注 AI 使用中的 token 消耗，并通过用量限制、模型选择和审批机制来控制支出。报道里的一个关键信号是，企业并不是简单放弃 AI，而是在尝试把“无限试用”转为“有边界地规模化使用”。

6 月底，关于企业控制 AI 成本的讨论也明显增多。华尔街日报在 6 月 30 日报道中提到，一些企业开始借鉴云计算时代的 FinOps 方法，用监控面板、支出上限、showback 和 chargeback 等方式管理 AI token 支出。原因并不难理解：在早期试点阶段，一个团队、一个部门、一个演示项目的成本容易被忽略；但当 AI 嵌入真实业务流程后，调用量会随着员工规模、客户请求、自动化任务和 Agent 链路快速放大。

与此同时，学术研究也在提醒企业，AI 成本不能只看单次问答价格。

6 月 10 日，一篇题为《AI Tokenomics: The Economics of Tokens, Computation, and Pricing in Foundation Models》的论文提出，token 已经成为连接信息处理、计算、内存、能耗、定价和经济价值的基础计量单位。论文的核心价值在于，它把 AI 成本从“模型价格表”扩展为一套经营问题：哪些场景值得用更强模型，哪些场景应该用轻量模型，哪些任务因为上下文过长或反复调用而变得不经济。

另一篇 4 月发布、4 月 29 日修订的研究《How Do AI Agents Spend Your Money?》则从 AI Agent 角度指出，Agent 型任务的 token 消耗高度波动，输入 token 是主要成本来源，而且更高消耗并不必然带来更高准确率。企业如果只计算“调用一次模型多少钱”，很容易低估 Agent 进入生产后的真实消耗。

这些信息共同指向一个变化：企业 AI 的竞争不再只是“谁更早接入模型”，而是“谁能把 AI 使用变成可度量、可分层、可优化的运营能力”。

AI 成本失控，通常不是因为员工用太多

很多管理者听到 AI 成本治理，第一反应是限制员工使用次数。这种做法短期有效，但容易误伤真正有价值的场景。

企业 AI 成本上升，通常不是因为员工“多问了几个问题”，而是因为以下几个问题没有被管理：

第一，所有任务都调用同一种高规格模型。

摘要、分类、格式转换、内部制度查询、复杂方案推理、代码生成、合同条款分析，本来应该使用不同能力等级的模型。如果企业没有模型路由机制，简单任务也会消耗高成本资源。

第二，上下文越来越长，却没有知识检索和压缩策略。

很多 AI 系统为了“让模型知道更多”，不断把长文档、历史对话、客户资料和制度内容塞进上下文。这样做短期方便，但长期会显著增加 token 消耗，也增加过期信息、无关信息干扰答案的概率。

第三，Agent 自动执行时缺少停止条件。

Agent 一旦进入多步骤任务，可能会查询系统、调用工具、生成中间结果、再次验证、重新规划。如果没有任务边界、失败次数、预算上限和人工升级规则，成本会在后台持续发生，而业务团队未必能及时感知。

第四，企业只统计调用成本，没有统计业务收益。

如果只看 AI 账单，所有使用都是成本；如果能把 AI 使用与节省的工时、缩短的交付周期、提升的转化率、减少的返工、降低的服务等待时间关联起来，管理层才能判断哪些场景应该扩大，哪些场景应该收缩。

第五，试点成功后没有重新设计流程。

不少企业在试点阶段证明 AI “能做”，但上线后仍沿用原来的人工流程。结果是 AI 多了一层成本，却没有真正减少等待、重复录入、人工分发和跨部门确认。这类项目看上去使用量很高，ROI 却并不清楚。

企业需要建立 AI FinOps，而不是只做预算审批

云计算普及后，企业逐渐形成了 FinOps 思维：技术团队、业务团队和财务团队共同管理云资源使用，让成本、性能和业务价值保持动态平衡。

AI 也需要类似机制。

但 AI FinOps 不能只是把账单拆给各部门。它至少需要回答五个问题：

一是场景是否分级。

企业应把 AI 使用场景分成基础辅助、专业增强、流程自动化和高风险决策支持几类。不同等级对应不同模型、不同权限、不同复核要求和不同预算口径。

二是模型是否可路由。

不是所有任务都需要最强模型。企业应该根据任务复杂度、风险等级、响应速度、成本上限和结果质量要求，建立模型选择策略。简单任务优先使用低成本模型或规则系统，复杂任务再调用高能力模型。

三是上下文是否可治理。

真正成熟的 AI 系统，不是把所有资料都塞给模型，而是先检索、过滤、排序、压缩，再把必要信息交给模型。知识库质量、文档版本、权限边界和引用来源，都会直接影响成本和答案质量。

四是 Agent 是否有预算和停止规则。

企业需要给自动化任务设置最大调用次数、最大 token 消耗、失败重试次数、异常升级条件和人工确认节点。否则，Agent 越“自主”，越可能在不可见处制造成本和风险。

五是 ROI 是否按业务结果衡量。

AI 项目不能只汇报使用次数、生成字数和调用量。更有价值的指标包括：客服平均处理时长是否下降，销售方案准备时间是否缩短，研发缺陷修复周期是否改善，财务对账返工是否减少，人力政策咨询是否减少人工转接，管理报告是否更快生成并被采用。

这些指标能帮助企业区分两类 AI 使用：一种只是新鲜感驱动的高消耗，另一种是真正进入流程、减少摩擦、释放产能的有效投入。

AI FinOps 运营地图、模型路由、预算规则与 ROI 闭环插图 — 成熟的 AI 成本治理需要同时看见使用台账、模型路由、预算停止规则和业务结果反馈。

成本治理不是财务部门一个人的事

AI 成本治理很容易被误解为财务部门的控制动作。但在企业内部，它必须是技术、业务、财务、法务和管理层共同完成的运营设计。

技术团队需要负责模型路由、缓存、检索增强、日志追踪、权限控制和系统稳定性。

业务团队需要定义哪些流程值得 AI 介入，哪些结果算成功，哪些异常必须升级。

财务团队需要把 AI 消耗从统一费用拆解到业务单元、项目、场景和流程结果上，避免只有总账没有经营分析。

法务和合规团队需要定义哪些数据不能输入、哪些输出不能直接外发、哪些高风险任务必须保留人工责任。

管理层则需要决定：企业希望 AI 优先优化什么，是缩短交付周期、提高服务质量、降低重复劳动、提升销售转化，还是增强研发效率。目标不同，成本治理方式也不同。

如果没有这层共识，企业很容易走向两个极端：要么放任使用，账单上涨后突然收紧；要么一开始就严控调用，导致员工和团队不愿意把 AI 放进真实工作。

更好的做法，是把 AI 当成一种新的生产资源来管理。它既不是免费工具，也不是纯粹成本项，而是一种需要被配置、调度、监控和复盘的能力。

对正在推进 AI 落地的企业，建议先做四件事

第一，建立 AI 使用台账。

不要只看供应商账单，而要按部门、场景、任务类型、模型、调用量、token 消耗、成功率、人工复核率和业务结果进行记录。没有台账，就没有优化。

第二，选择 3 到 5 个高价值流程做 ROI 闭环。

企业不必一开始覆盖全部场景。更实际的路径，是选择客服工单、销售方案、研发代码评审、财务报表分析、人力制度问答等高频流程，建立从调用成本到业务收益的完整复盘。

第三，为不同任务设计模型和权限策略。

简单任务用轻量方案，复杂任务用高能力模型；低风险任务允许自动化，高风险任务保留人工确认；公共知识可以更开放，敏感数据必须受权限和审计约束。

第四，把成本指标纳入 AI 项目验收。

验收不应只问“效果好不好”，还应问“单位任务成本是多少”“结果采用率是多少”“人工返工减少多少”“异常升级是否及时”“随着规模扩大，成本曲线是否可接受”。

这四件事做起来并不复杂，但它们能帮助企业避免一个常见误区：只在 AI 项目启动时讨论预算，却在 AI 真正进入生产后缺少运行管理。

一个现实判断

企业 AI 的下一阶段，不会是“无限调用换增长”，也不会是“严格限额保预算”。真正可持续的路径，是在业务价值和运行成本之间建立动态平衡。

如果企业不能看清 AI 消耗发生在哪里，就很难判断该扩大还是收缩；如果企业不能把 AI 使用和业务结果关联起来，就会在账单上涨时失去信心；如果企业不能给 Agent 和自动化任务设定边界，规模化反而会放大不可控成本。

反过来，如果企业能把 AI 成本治理、模型路由、知识治理和业务 ROI 放在同一张运营图上，AI 就不只是一个“更聪明的工具”，而会成为一套可以持续优化的生产系统。

未来真正有竞争力的企业，不一定是 AI 用得最多的企业，而是能清楚知道每一次 AI 调用为什么发生、值不值得、如何改进的企业。

这才是企业级 AI 从试点走向规模化的关键一步。

企业 AI 开始进入成本治理阶段：不是少用，而是把每一次调用变成可管理的投入

最近的信号：企业开始给 AI 消耗设边界

AI 成本失控，通常不是因为员工用太多

企业需要建立 AI FinOps，而不是只做预算审批

成本治理不是财务部门一个人的事

对正在推进 AI 落地的企业，建议先做四件事

一个现实判断

引用来源

继续阅读

企业内部 AI 的真正分水岭：员工敢不敢把答案用于工作

AI 客服不是“替代坐席”的项目，而是一次客户体验的重新验收

企业 AI 正从“会话工具”进入“委派系统”：最近一份 Codex 研究给落地负责人提了醒

需要按行业订阅新闻更新？