智能体内省调试

当智能体运行反复失败、消耗令牌却无进展、在相同工具上循环或偏离预期任务时，使用此技能。

这是一个工作流技能，而非隐藏运行时。它教会智能体在升级给人类之前，系统性地自我调试。

何时激活

达到最大工具调用/循环限制失败
重复重试但无任何进展
上下文增长或提示漂移导致输出质量下降
文件系统或环境状态与预期不匹配
可通过诊断和较小纠正措施恢复的工具故障

范围边界

激活此技能用于：

在盲目重试前捕获失败状态
诊断常见的智能体特定失败模式
应用受限的恢复操作
生成结构化的人类可读调试报告

请勿将此技能作为以下情况的主要来源：

代码变更后的功能验证；请使用 verification-loop
当已有更窄的 ECC 技能时的框架特定调试
当前框架无法自动强制执行的运行时承诺

四阶段循环

阶段 1：失败捕获

在尝试恢复之前，精确记录失败信息。

捕获内容：

错误类型、消息和堆栈跟踪（如可用）
最后有意义的工具调用序列
智能体当时试图完成的任务
当前上下文压力：重复提示、过大的粘贴日志、重复的计划或失控的笔记
当前环境假设：工作目录、分支、相关服务状态、预期文件

最小捕获模板：

## 失败捕获
- 会话/任务：
- 进行中的目标：
- 错误：
- 最后成功的步骤：
- 最后失败的工具/命令：
- 观察到的重复模式：
- 需验证的环境假设：

阶段 2：根因诊断

在更改任何内容之前，将失败与已知模式匹配。

模式	可能原因	检查
最大工具调用/重复相同命令	循环或无退出观察路径	检查最后 N 次工具调用是否存在重复
上下文溢出/推理能力下降	无界笔记、重复计划、过大日志	检查近期上下文是否存在重复和低信号批量内容
`ECONNREFUSED` / 超时	服务不可用或端口错误	验证服务健康状态、URL 和端口假设
`429` / 配额耗尽	重试风暴或缺少退避	统计重复调用次数并检查重试间隔
写入后文件缺失/差异过时	竞态、工作目录错误或分支漂移	重新检查路径、工作目录、git 状态和实际文件是否存在
“修复”后测试仍然失败	假设错误	隔离确切失败的测试并重新推导错误

诊断问题：

这是逻辑失败、状态失败、环境失败还是策略失败？
智能体是否丢失了真实目标并开始优化错误的子任务？
失败是确定性的还是瞬态的？
能够验证诊断的最小可逆操作是什么？

阶段 3：受限恢复

使用改变诊断面的最小操作进行恢复。

安全恢复操作：

停止重复重试并重新陈述假设
修剪低信号上下文，仅保留活跃目标、阻碍因素和证据
重新检查实际文件系统/分支/进程状态
将任务缩小到一个失败的命令、一个文件或一个测试
从推测性推理切换到直接观察
当失败风险高或受外部阻碍时升级给人类

不要声称不支持的自动修复操作，如“重置智能体状态”或“更新框架配置”，除非你正在当前环境中通过真实工具实际执行这些操作。

受限恢复检查清单：

## 恢复操作
- 选择的诊断方式：
- 采取的最小操作：
- 为何此操作安全：
- 哪些证据能证明修复生效：

阶段 4：内省报告

以一份使恢复过程对下一个智能体或人类清晰可读的报告结束。

## 代理自调试报告
- 会话/任务：
- 失败原因：
- 根本原因：
- 恢复措施：
- 结果：成功 | 部分成功 | 受阻
- Token/时间消耗风险：
- 是否需要后续跟进：
- 后续需编码的预防性变更：

恢复启发式方法

按顺序优先选择以下干预措施：

用一句话重新陈述真实目标。
验证世界状态，而非依赖记忆。
缩小失败范围。
运行一次判别性检查。
然后才重试。

错误模式：

用略微不同的措辞重复相同操作三次

正确模式：

捕获失败
分类模式
运行一次直接检查
仅当检查支持时才更改计划

与 ECC 集成

如果代码已更改，在恢复后使用 verification-loop。
当失败模式值得转化为本能或后续技能时，使用 continuous-learning-v2。
当问题不是技术失败而是决策模糊时，使用 council。
如果失败源于冲突的本地状态或仓库漂移，使用 workspace-surface-audit。

输出标准

当此技能激活时，不要仅以“我已修复”结束。

始终提供：

失败模式
根因假设
恢复操作
证明情况已改善或仍受阻的证据

docs/zh-CN/skills/agent-introspection-debugging