一个值得关注的信号:大规模 AI 客服开始有了可量化证据
6 月,Nubank 多位研究者发布了一篇关于客户支持 AI Agent 的论文,介绍他们在超过 1 亿用户规模下的实践框架。论文的重点不是宣传模型能力,而是把 AI 客服做成“评估驱动”的生产系统:先拆解场景,再建立离线评测、仿真测试、线上 A/B 实验和持续监控,最后再逐步进入真实客户服务流程。
其中一个案例很有代表性:在银行卡交付相关场景中,Nubank 的 AI Agent 通过主动推理客户意图、调用内部工具并给出下一步处理,使 AI 事务型净推荐值提升 37 个百分点,自助服务率提升 29 个百分点。论文还提到,在部分生产场景里,AI Agent 的满意度已经接近专家人工坐席。
这类数据对企业客户的意义很直接:AI 客服不是不能做,也不是只能停留在 FAQ 问答。只要场景边界、工具权限、评估方法和人工复核设计得当,AI 可以承担更接近真实业务办理的服务任务。
但这同时也说明,真正困难的部分并不只是“接一个大模型”。
另一个现实:企业想得很快,客户接受得没有那么快
Adobe 2026 AI and Digital Trends 相关报道显示,近 78% 的组织预计未来 18 个月会让 Agentic AI 直接处理客户支持互动,但只有 16% 的组织已经完成组织级部署。报道还提到,约 75% 的受访者把数据集成和数据质量视为部署 Agentic AI 的主要挑战;在消费者侧,企业对客户接受 AI Agent 的判断也明显乐观于消费者自己的反馈。
同样在 6 月,新加坡 AI Safety Institute 和韩国 AI Safety Institute 联合发布的工具型 LLM Agent 数据泄露评估也给了企业一个提醒:在客户支持、DevOps、企业生产力等真实任务中,Agent 即使能完成任务,也可能在非恶意场景下访问过多信息、把信息发给不合适对象,或者违反数据处理边界。也就是说,能力测试和安全测试必须分开做。
这恰恰是企业 AI 客服最容易低估的风险:内部看见的是效率,客户感受到的是一次服务。
如果客户问题被错误理解、上下文丢失、重复追问、无法转人工,或者 AI 给出看似确定但实际不可执行的承诺,企业节省下来的坐席成本,可能会在客户流失、投诉升级和品牌信任损耗中被重新付出。
所以,AI 客服的核心不应是“尽可能少让人工介入”,而是“在合适的任务上让客户更快得到可靠结果”。
企业落地 AI 客服,先回答三类问题
第一类问题是服务边界。
哪些问题适合 AI 直接处理?哪些只能由 AI 做信息收集和预处理?哪些必须立即转人工?这不是技术部门单独能决定的,需要客服、业务、法务、风控和品牌团队共同定义。
更实际的做法,是先从高频、低风险、结果可校验的场景切入。例如订单状态查询、材料补充提醒、政策解释、故障初步排查、工单分类、客户信息核对等。这些任务的共同点是:客户目标清晰,企业有确定数据源,结果可以被检查,出错后也有补救路径。
第二类问题是数据和工具。
很多 AI 客服项目失败,不是因为模型不会说话,而是因为它拿不到可靠的业务事实。客户问的是“我的订单为什么还没到”“这笔费用怎么算”“这个合同条款适不适用”,背后需要的是订单系统、计费系统、合同系统、知识库、工单系统和权限体系。
如果这些数据没有打通,AI 只能用漂亮话填补事实空白。短期看似减少了人工,长期会把客户问题推向更复杂的二次处理。
第三类问题是体验验收。
客服场景不能只看调用量和自动化率。更关键的指标应该包括:
这些指标比“节省了多少坐席时间”更接近客户真实感受,也更能帮助企业判断 AI 是否真的进入可持续运营。
- 首次问题解决率
- 转人工前的信息完整度
- AI 答复被人工修正的比例
- 客户重复咨询率
- 投诉升级率
- 客户满意度和净推荐值
- 高风险问题的停止与升级是否及时
对企业管理者的建议:把 AI 客服当作服务产品来建设
如果企业准备在未来半年推进客服 AI Agent,不建议一开始就追求大而全。更稳妥的路径,是把它当成一个持续迭代的服务产品,而不是一次性系统采购。
第一步,建立场景分级清单。把客服问题按频率、风险、数据可得性和验收难度分层,优先选择“高频、低风险、事实明确”的任务上线。
第二步,建立知识和数据责任人。AI 客服回答质量取决于知识库、业务规则和系统数据是否准确。每一类关键答案都要有业务 owner,不能把内容维护责任全部推给技术团队。
第三步,设计透明的客户体验。客户应当知道自己何时在与 AI 互动,也应该能在必要时顺畅转人工。透明不是降低体验,而是保护信任。
第四步,建立人工复核与异常升级机制。AI 可以提高处理效率,但不应替代责任归属。涉及投诉、合规、退款、合同、医疗、金融等高风险问题时,企业必须定义清楚哪些动作只能由人确认。
第五步,用真实业务指标复盘,而不是只看自动化率。一个成熟的 AI 客服项目,应该能回答:客户是否更快解决问题?人工坐席是否减少重复劳动?复杂问题是否被更准确地分流?服务质量是否可持续提升?
简短结论
AI 客服进入企业核心流程,已经不是遥远趋势。Nubank 的大规模实践说明,在评估体系和业务工具足够扎实的前提下,AI Agent 可以在真实客户支持场景中创造可量化价值。
但对多数企业来说,真正的挑战不是“有没有 AI 客服入口”,而是“能不能把 AI 客服做成可信、可控、可验收的服务能力”。
下一阶段,企业不应只把 AI 客服当作降本工具,而应把它作为客户体验重构项目来推进:先定义边界,再打通数据,建立评估,设计转人工机制,最后用客户结果而不是内部热闹程度来判断成败。
谁能先把这套能力建起来,谁就能在 AI 落地中获得更真实的效率,也获得更稳定的客户信任。