docs/zh-CN/skills/agent-introspection-debugging

stars:0
forks:0
watches:0
last updated:N/A

智能体内省调试

当智能体运行反复失败、消耗令牌却无进展、在相同工具上循环或偏离预期任务时,使用此技能。

这是一个工作流技能,而非隐藏运行时。它教会智能体在升级给人类之前,系统性地自我调试。

何时激活

  • 达到最大工具调用/循环限制失败
  • 重复重试但无任何进展
  • 上下文增长或提示漂移导致输出质量下降
  • 文件系统或环境状态与预期不匹配
  • 可通过诊断和较小纠正措施恢复的工具故障

范围边界

激活此技能用于:

  • 在盲目重试前捕获失败状态
  • 诊断常见的智能体特定失败模式
  • 应用受限的恢复操作
  • 生成结构化的人类可读调试报告

请勿将此技能作为以下情况的主要来源:

  • 代码变更后的功能验证;请使用 verification-loop
  • 当已有更窄的 ECC 技能时的框架特定调试
  • 当前框架无法自动强制执行的运行时承诺

四阶段循环

阶段 1:失败捕获

在尝试恢复之前,精确记录失败信息。

捕获内容:

  • 错误类型、消息和堆栈跟踪(如可用)
  • 最后有意义的工具调用序列
  • 智能体当时试图完成的任务
  • 当前上下文压力:重复提示、过大的粘贴日志、重复的计划或失控的笔记
  • 当前环境假设:工作目录、分支、相关服务状态、预期文件

最小捕获模板:

## 失败捕获
- 会话/任务:
- 进行中的目标:
- 错误:
- 最后成功的步骤:
- 最后失败的工具/命令:
- 观察到的重复模式:
- 需验证的环境假设:

阶段 2:根因诊断

在更改任何内容之前,将失败与已知模式匹配。

模式可能原因检查
最大工具调用/重复相同命令循环或无退出观察路径检查最后 N 次工具调用是否存在重复
上下文溢出/推理能力下降无界笔记、重复计划、过大日志检查近期上下文是否存在重复和低信号批量内容
ECONNREFUSED / 超时服务不可用或端口错误验证服务健康状态、URL 和端口假设
429 / 配额耗尽重试风暴或缺少退避统计重复调用次数并检查重试间隔
写入后文件缺失/差异过时竞态、工作目录错误或分支漂移重新检查路径、工作目录、git 状态和实际文件是否存在
“修复”后测试仍然失败假设错误隔离确切失败的测试并重新推导错误

诊断问题:

  • 这是逻辑失败、状态失败、环境失败还是策略失败?
  • 智能体是否丢失了真实目标并开始优化错误的子任务?
  • 失败是确定性的还是瞬态的?
  • 能够验证诊断的最小可逆操作是什么?

阶段 3:受限恢复

使用改变诊断面的最小操作进行恢复。

安全恢复操作:

  • 停止重复重试并重新陈述假设
  • 修剪低信号上下文,仅保留活跃目标、阻碍因素和证据
  • 重新检查实际文件系统/分支/进程状态
  • 将任务缩小到一个失败的命令、一个文件或一个测试
  • 从推测性推理切换到直接观察
  • 当失败风险高或受外部阻碍时升级给人类

不要声称不支持的自动修复操作,如“重置智能体状态”或“更新框架配置”,除非你正在当前环境中通过真实工具实际执行这些操作。

受限恢复检查清单:

## 恢复操作
- 选择的诊断方式:
- 采取的最小操作:
- 为何此操作安全:
- 哪些证据能证明修复生效:

阶段 4:内省报告

以一份使恢复过程对下一个智能体或人类清晰可读的报告结束。

## 代理自调试报告
- 会话/任务:
- 失败原因:
- 根本原因:
- 恢复措施:
- 结果:成功 | 部分成功 | 受阻
- Token/时间消耗风险:
- 是否需要后续跟进:
- 后续需编码的预防性变更:

恢复启发式方法

按顺序优先选择以下干预措施:

  1. 用一句话重新陈述真实目标。
  2. 验证世界状态,而非依赖记忆。
  3. 缩小失败范围。
  4. 运行一次判别性检查。
  5. 然后才重试。

错误模式:

  • 用略微不同的措辞重复相同操作三次

正确模式:

  • 捕获失败
  • 分类模式
  • 运行一次直接检查
  • 仅当检查支持时才更改计划

与 ECC 集成

  • 如果代码已更改,在恢复后使用 verification-loop
  • 当失败模式值得转化为本能或后续技能时,使用 continuous-learning-v2
  • 当问题不是技术失败而是决策模糊时,使用 council
  • 如果失败源于冲突的本地状态或仓库漂移,使用 workspace-surface-audit

输出标准

当此技能激活时,不要仅以“我已修复”结束。

始终提供:

  • 失败模式
  • 根因假设
  • 恢复操作
  • 证明情况已改善或仍受阻的证据
    Good AI Tools