果热科技新闻资讯频道上线,持续更新 AI 交付实践
新闻资讯 / 正文

企业 AI 开始进入成本治理阶段:不是少用,而是把每一次调用变成可管理的投入

过去两年,很多企业推进生成式 AI 的逻辑很直接:先让员工用起来,先把场景跑起来,先证明 AI 能不能提高效率。

企业级新闻 发布时间:2026-07-03 10 分钟阅读
企业 AI 成本治理与 AI FinOps 运营控制台插图
企业 AI 从试点走向规模化后,成本、模型路由、权限和 ROI 都需要进入同一套运营治理视图。

过去两年,很多企业推进生成式 AI 的逻辑很直接:先让员工用起来,先把场景跑起来,先证明 AI 能不能提高效率。

最近的信号:企业开始给 AI 消耗设边界

7 月 1 日,Business Insider 报道了 UBS 对企业 AI 支出的观察:越来越多公司开始关注 AI 使用中的 token 消耗,并通过用量限制、模型选择和审批机制来控制支出。报道里的一个关键信号是,企业并不是简单放弃 AI,而是在尝试把“无限试用”转为“有边界地规模化使用”。

6 月底,关于企业控制 AI 成本的讨论也明显增多。华尔街日报在 6 月 30 日报道中提到,一些企业开始借鉴云计算时代的 FinOps 方法,用监控面板、支出上限、showback 和 chargeback 等方式管理 AI token 支出。原因并不难理解:在早期试点阶段,一个团队、一个部门、一个演示项目的成本容易被忽略;但当 AI 嵌入真实业务流程后,调用量会随着员工规模、客户请求、自动化任务和 Agent 链路快速放大。

与此同时,学术研究也在提醒企业,AI 成本不能只看单次问答价格。

6 月 10 日,一篇题为《AI Tokenomics: The Economics of Tokens, Computation, and Pricing in Foundation Models》的论文提出,token 已经成为连接信息处理、计算、内存、能耗、定价和经济价值的基础计量单位。论文的核心价值在于,它把 AI 成本从“模型价格表”扩展为一套经营问题:哪些场景值得用更强模型,哪些场景应该用轻量模型,哪些任务因为上下文过长或反复调用而变得不经济。

另一篇 4 月发布、4 月 29 日修订的研究《How Do AI Agents Spend Your Money?》则从 AI Agent 角度指出,Agent 型任务的 token 消耗高度波动,输入 token 是主要成本来源,而且更高消耗并不必然带来更高准确率。企业如果只计算“调用一次模型多少钱”,很容易低估 Agent 进入生产后的真实消耗。

这些信息共同指向一个变化:企业 AI 的竞争不再只是“谁更早接入模型”,而是“谁能把 AI 使用变成可度量、可分层、可优化的运营能力”。

AI 成本失控,通常不是因为员工用太多

很多管理者听到 AI 成本治理,第一反应是限制员工使用次数。这种做法短期有效,但容易误伤真正有价值的场景。

企业 AI 成本上升,通常不是因为员工“多问了几个问题”,而是因为以下几个问题没有被管理:

第一,所有任务都调用同一种高规格模型。

摘要、分类、格式转换、内部制度查询、复杂方案推理、代码生成、合同条款分析,本来应该使用不同能力等级的模型。如果企业没有模型路由机制,简单任务也会消耗高成本资源。

第二,上下文越来越长,却没有知识检索和压缩策略。

很多 AI 系统为了“让模型知道更多”,不断把长文档、历史对话、客户资料和制度内容塞进上下文。这样做短期方便,但长期会显著增加 token 消耗,也增加过期信息、无关信息干扰答案的概率。

第三,Agent 自动执行时缺少停止条件。

Agent 一旦进入多步骤任务,可能会查询系统、调用工具、生成中间结果、再次验证、重新规划。如果没有任务边界、失败次数、预算上限和人工升级规则,成本会在后台持续发生,而业务团队未必能及时感知。

第四,企业只统计调用成本,没有统计业务收益。

如果只看 AI 账单,所有使用都是成本;如果能把 AI 使用与节省的工时、缩短的交付周期、提升的转化率、减少的返工、降低的服务等待时间关联起来,管理层才能判断哪些场景应该扩大,哪些场景应该收缩。

第五,试点成功后没有重新设计流程。

不少企业在试点阶段证明 AI “能做”,但上线后仍沿用原来的人工流程。结果是 AI 多了一层成本,却没有真正减少等待、重复录入、人工分发和跨部门确认。这类项目看上去使用量很高,ROI 却并不清楚。

企业需要建立 AI FinOps,而不是只做预算审批

云计算普及后,企业逐渐形成了 FinOps 思维:技术团队、业务团队和财务团队共同管理云资源使用,让成本、性能和业务价值保持动态平衡。

AI 也需要类似机制。

但 AI FinOps 不能只是把账单拆给各部门。它至少需要回答五个问题:

一是场景是否分级。

企业应把 AI 使用场景分成基础辅助、专业增强、流程自动化和高风险决策支持几类。不同等级对应不同模型、不同权限、不同复核要求和不同预算口径。

二是模型是否可路由。

不是所有任务都需要最强模型。企业应该根据任务复杂度、风险等级、响应速度、成本上限和结果质量要求,建立模型选择策略。简单任务优先使用低成本模型或规则系统,复杂任务再调用高能力模型。

三是上下文是否可治理。

真正成熟的 AI 系统,不是把所有资料都塞给模型,而是先检索、过滤、排序、压缩,再把必要信息交给模型。知识库质量、文档版本、权限边界和引用来源,都会直接影响成本和答案质量。

四是 Agent 是否有预算和停止规则。

企业需要给自动化任务设置最大调用次数、最大 token 消耗、失败重试次数、异常升级条件和人工确认节点。否则,Agent 越“自主”,越可能在不可见处制造成本和风险。

五是 ROI 是否按业务结果衡量。

AI 项目不能只汇报使用次数、生成字数和调用量。更有价值的指标包括:客服平均处理时长是否下降,销售方案准备时间是否缩短,研发缺陷修复周期是否改善,财务对账返工是否减少,人力政策咨询是否减少人工转接,管理报告是否更快生成并被采用。

这些指标能帮助企业区分两类 AI 使用:一种只是新鲜感驱动的高消耗,另一种是真正进入流程、减少摩擦、释放产能的有效投入。

AI FinOps 运营地图、模型路由、预算规则与 ROI 闭环插图
成熟的 AI 成本治理需要同时看见使用台账、模型路由、预算停止规则和业务结果反馈。

成本治理不是财务部门一个人的事

AI 成本治理很容易被误解为财务部门的控制动作。但在企业内部,它必须是技术、业务、财务、法务和管理层共同完成的运营设计。

技术团队需要负责模型路由、缓存、检索增强、日志追踪、权限控制和系统稳定性。

业务团队需要定义哪些流程值得 AI 介入,哪些结果算成功,哪些异常必须升级。

财务团队需要把 AI 消耗从统一费用拆解到业务单元、项目、场景和流程结果上,避免只有总账没有经营分析。

法务和合规团队需要定义哪些数据不能输入、哪些输出不能直接外发、哪些高风险任务必须保留人工责任。

管理层则需要决定:企业希望 AI 优先优化什么,是缩短交付周期、提高服务质量、降低重复劳动、提升销售转化,还是增强研发效率。目标不同,成本治理方式也不同。

如果没有这层共识,企业很容易走向两个极端:要么放任使用,账单上涨后突然收紧;要么一开始就严控调用,导致员工和团队不愿意把 AI 放进真实工作。

更好的做法,是把 AI 当成一种新的生产资源来管理。它既不是免费工具,也不是纯粹成本项,而是一种需要被配置、调度、监控和复盘的能力。

对正在推进 AI 落地的企业,建议先做四件事

第一,建立 AI 使用台账。

不要只看供应商账单,而要按部门、场景、任务类型、模型、调用量、token 消耗、成功率、人工复核率和业务结果进行记录。没有台账,就没有优化。

第二,选择 3 到 5 个高价值流程做 ROI 闭环。

企业不必一开始覆盖全部场景。更实际的路径,是选择客服工单、销售方案、研发代码评审、财务报表分析、人力制度问答等高频流程,建立从调用成本到业务收益的完整复盘。

第三,为不同任务设计模型和权限策略。

简单任务用轻量方案,复杂任务用高能力模型;低风险任务允许自动化,高风险任务保留人工确认;公共知识可以更开放,敏感数据必须受权限和审计约束。

第四,把成本指标纳入 AI 项目验收。

验收不应只问“效果好不好”,还应问“单位任务成本是多少”“结果采用率是多少”“人工返工减少多少”“异常升级是否及时”“随着规模扩大,成本曲线是否可接受”。

这四件事做起来并不复杂,但它们能帮助企业避免一个常见误区:只在 AI 项目启动时讨论预算,却在 AI 真正进入生产后缺少运行管理。

一个现实判断

企业 AI 的下一阶段,不会是“无限调用换增长”,也不会是“严格限额保预算”。真正可持续的路径,是在业务价值和运行成本之间建立动态平衡。

如果企业不能看清 AI 消耗发生在哪里,就很难判断该扩大还是收缩;如果企业不能把 AI 使用和业务结果关联起来,就会在账单上涨时失去信心;如果企业不能给 Agent 和自动化任务设定边界,规模化反而会放大不可控成本。

反过来,如果企业能把 AI 成本治理、模型路由、知识治理和业务 ROI 放在同一张运营图上,AI 就不只是一个“更聪明的工具”,而会成为一套可以持续优化的生产系统。

未来真正有竞争力的企业,不一定是 AI 用得最多的企业,而是能清楚知道每一次 AI 调用为什么发生、值不值得、如何改进的企业。

这才是企业级 AI 从试点走向规模化的关键一步。

引用来源

以下公开资料用于支撑本文观点,便于读者进行可信校验。

  1. 1
    UBS says the majority of enterprise companies it's talked to recently are 'throttling AI spend'

    Business Insider · 发布时间:2026-07-01 · 访问日期:2026-07-03

  2. 2
    How Companies Are Managing AI Token Spend

    The Wall Street Journal · 发布时间:2026-06-30 · 访问日期:2026-07-03

  3. 3
    AI Tokenomics: The Economics of Tokens, Computation, and Pricing in Foundation Models

    arXiv · 发布时间:2026-06-10 · 访问日期:2026-07-03

  4. 4
    How Do AI Agents Spend Your Money? Analyzing and Predicting Token Consumption in Agentic Coding Tasks

    arXiv(2026-04-24,2026-04-29 修订) · 访问日期:2026-07-03

企业级新闻客服智能体AI落地服务体验

继续阅读

了解更多 AI 交付实践与行业观察。

2026-07-02 企业级新闻

企业内部 AI 的真正分水岭:员工敢不敢把答案用于工作

过去一年,很多企业推进生成式 AI 的第一步,是给员工开通工具、组织培训、鼓励大家多用。这个阶段很必要,但它解决的主要是“有没有入口”的问题。

阅读全文
2026-06-29 企业级新闻

AI 客服不是“替代坐席”的项目,而是一次客户体验的重新验收

企业推进 AI 落地时,客服往往是最容易被提上日程的场景:量大、重复、知识库明确、成本压力明显,也最容易做出演示效果。

阅读全文
2026-06-28 企业级新闻

企业 AI 正从“会话工具”进入“委派系统”:最近一份 Codex 研究给落地负责人提了醒

过去很多企业衡量 AI 推进进度,习惯看三个指标:

阅读全文

需要按行业订阅新闻更新?

可选择制造、贸易、电商等垂直方向接收交付动态与方法论更新。后续内容页将支持按标签和行业进行聚合阅读。

预约沟通
果热科技
果热科技