迭代检索模式 (Iterative Retrieval Pattern)
解决多 agent 工作流中的“上下文问题”,即子 agent 在开始工作之前不知道它们需要什么上下文。
问题
子 agent 生成时上下文有限。它们不知道:
- •哪些文件包含相关代码
- •代码库中存在什么模式
- •项目使用什么术语
标准方法会失败:
- •发送一切: 超出上下文限制
- •什么也不发: Agent 缺乏关键信息
- •猜测需要什么: 经常出错
解决方案:迭代检索
一个逐步细化上下文的 4 阶段循环:
code
┌─────────────────────────────────────────────┐ │ │ │ ┌──────────┐ ┌──────────┐ │ │ │ DISPATCH │─────▶│ EVALUATE │ │ │ └──────────┘ └──────────┘ │ │ ▲ │ │ │ │ ▼ │ │ ┌──────────┐ ┌──────────┐ │ │ │ LOOP │◀─────│ REFINE │ │ │ └──────────┘ └──────────┘ │ │ │ │ Max 3 cycles, then proceed │ │ │ └─────────────────────────────────────────────┘
阶段 1: DISPATCH (分发)
初始广泛查询以收集候选文件:
javascript
// 从高层意图开始
const initialQuery = {
patterns: ['src/**/*.ts', 'lib/**/*.ts'],
keywords: ['authentication', 'user', 'session'],
excludes: ['*.test.ts', '*.spec.ts']
};
// 分发给检索 agent
const candidates = await retrieveFiles(initialQuery);
阶段 2: EVALUATE (评估)
评估检索内容的即相关性:
javascript
function evaluateRelevance(files, task) {
return files.map(file => ({
path: file.path,
relevance: scoreRelevance(file.content, task),
reason: explainRelevance(file.content, task),
missingContext: identifyGaps(file.content, task)
}));
}
评分标准:
- •High (0.8-1.0): 直接实施目标功能
- •Medium (0.5-0.7): 包含相关模式或类型
- •Low (0.2-0.4): 稍微相关
- •None (0-0.2): 不相关,排除
阶段 3: REFINE (优化)
根据评估更新搜索条件:
javascript
function refineQuery(evaluation, previousQuery) {
return {
// 添加在高相关性文件中发现的新模式
patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],
// 添加在代码库中发现的术语
keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],
// 排除确认不相关的路径
excludes: [...previousQuery.excludes, ...evaluation
.filter(e => e.relevance < 0.2)
.map(e => e.path)
],
// 针对特定缺口
focusAreas: evaluation
.flatMap(e => e.missingContext)
.filter(unique)
};
}
阶段 4: LOOP (循环)
使用优化后的条件重复(最多 3 个周期):
javascript
async function iterativeRetrieve(task, maxCycles = 3) {
let query = createInitialQuery(task);
let bestContext = [];
for (let cycle = 0; cycle < maxCycles; cycle++) {
const candidates = await retrieveFiles(query);
const evaluation = evaluateRelevance(candidates, task);
// 检查是否有足够的上下文
const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
return highRelevance;
}
// 优化并继续
query = refineQuery(evaluation, query);
bestContext = mergeContext(bestContext, highRelevance);
}
return bestContext;
}
实践示例
示例 1: Bug 修复上下文
code
Task: "修复认证令牌过期 bug" Cycle 1: DISPATCH: 在 src/** 中搜索 "token", "auth", "expiry" EVALUATE: 找到 auth.ts (0.9), tokens.ts (0.8), user.ts (0.3) REFINE: 添加 "refresh", "jwt" 关键字; 排除 user.ts Cycle 2: DISPATCH: 搜索优化后的术语 EVALUATE: 找到 session-manager.ts (0.95), jwt-utils.ts (0.85) REFINE: 足够的上下文 (2 high-relevance files) Result: auth.ts, tokens.ts, session-manager.ts, jwt-utils.ts
示例 2: 功能实现
code
Task: "添加 API 端点的速率限制" Cycle 1: DISPATCH: 在 routes/** 中搜索 "rate", "limit", "api" EVALUATE: 无匹配 - 代码库使用 "throttle" 术语 REFINE: 添加 "throttle", "middleware" 关键字 Cycle 2: DISPATCH: 搜索优化后的术语 EVALUATE: 找到 throttle.ts (0.9), middleware/index.ts (0.7) REFINE: 需要 router 模式 Cycle 3: DISPATCH: 搜索 "router", "express" 模式 EVALUATE: 找到 router-setup.ts (0.8) REFINE: 足够的上下文 Result: throttle.ts, middleware/index.ts, router-setup.ts
与 Agents 集成
在 agent prompts 中使用:
markdown
当为此任务检索上下文时: 1. 从广泛的关键字搜索开始 2. 评估每个文件的相关性 (0-1 等级) 3. 识别仍然缺失的上下文 4. 优化搜索条件并重复(最多 3 个周期) 5. 返回相关性 >= 0.7 的文件
最佳实践
- •从宽泛开始,逐步缩小 - 不要过度指定初始查询
- •学习代码库术语 - 第一个周期通常会揭示命名约定
- •跟踪缺失内容 - 明确的缺口识别驱动优化
- •在“足够好”时停止 - 3 个高相关性文件胜过 10 个平庸的
- •自信地排除 - 低相关性文件不会变得相关
相关
- •The Longform Guide - 子 agent 编排章节
- •
continuous-learningskill - 用于随时间改进的模式 - •
~/.claude/agents/中的 Agent 定义