迭代检索模式 (Iterative Retrieval Pattern)

解决多 agent 工作流中的“上下文问题”，即子 agent 在开始工作之前不知道它们需要什么上下文。

问题

子 agent 生成时上下文有限。它们不知道：

•哪些文件包含相关代码
•代码库中存在什么模式
•项目使用什么术语

标准方法会失败：

•发送一切: 超出上下文限制
•什么也不发: Agent 缺乏关键信息
•猜测需要什么: 经常出错

解决方案：迭代检索

一个逐步细化上下文的 4 阶段循环：

code

┌─────────────────────────────────────────────┐
│                                             │
│   ┌──────────┐      ┌──────────┐            │
│   │ DISPATCH │─────▶│ EVALUATE │            │
│   └──────────┘      └──────────┘            │
│        ▲                  │                 │
│        │                  ▼                 │
│   ┌──────────┐      ┌──────────┐            │
│   │   LOOP   │◀─────│  REFINE  │            │
│   └──────────┘      └──────────┘            │
│                                             │
│        Max 3 cycles, then proceed           │
│                                             │
└─────────────────────────────────────────────┘

阶段 1: DISPATCH (分发)

初始广泛查询以收集候选文件：

javascript

// 从高层意图开始
const initialQuery = {
  patterns: ['src/**/*.ts', 'lib/**/*.ts'],
  keywords: ['authentication', 'user', 'session'],
  excludes: ['*.test.ts', '*.spec.ts']
};

// 分发给检索 agent
const candidates = await retrieveFiles(initialQuery);

阶段 2: EVALUATE (评估)

评估检索内容的即相关性：

javascript

function evaluateRelevance(files, task) {
  return files.map(file => ({
    path: file.path,
    relevance: scoreRelevance(file.content, task),
    reason: explainRelevance(file.content, task),
    missingContext: identifyGaps(file.content, task)
  }));
}

评分标准：

•High (0.8-1.0): 直接实施目标功能
•Medium (0.5-0.7): 包含相关模式或类型
•Low (0.2-0.4): 稍微相关
•None (0-0.2): 不相关，排除

阶段 3: REFINE (优化)

根据评估更新搜索条件：

javascript

function refineQuery(evaluation, previousQuery) {
  return {
    // 添加在高相关性文件中发现的新模式
    patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],

    // 添加在代码库中发现的术语
    keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],

    // 排除确认不相关的路径
    excludes: [...previousQuery.excludes, ...evaluation
      .filter(e => e.relevance < 0.2)
      .map(e => e.path)
    ],

    // 针对特定缺口
    focusAreas: evaluation
      .flatMap(e => e.missingContext)
      .filter(unique)
  };
}

阶段 4: LOOP (循环)

使用优化后的条件重复（最多 3 个周期）：

javascript

async function iterativeRetrieve(task, maxCycles = 3) {
  let query = createInitialQuery(task);
  let bestContext = [];

  for (let cycle = 0; cycle < maxCycles; cycle++) {
    const candidates = await retrieveFiles(query);
    const evaluation = evaluateRelevance(candidates, task);

    // 检查是否有足够的上下文
    const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
    if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
      return highRelevance;
    }

    // 优化并继续
    query = refineQuery(evaluation, query);
    bestContext = mergeContext(bestContext, highRelevance);
  }

  return bestContext;
}

实践示例

示例 1: Bug 修复上下文

code

Task: "修复认证令牌过期 bug"

Cycle 1:
  DISPATCH: 在 src/** 中搜索 "token", "auth", "expiry"
  EVALUATE: 找到 auth.ts (0.9), tokens.ts (0.8), user.ts (0.3)
  REFINE: 添加 "refresh", "jwt" 关键字; 排除 user.ts

Cycle 2:
  DISPATCH: 搜索优化后的术语
  EVALUATE: 找到 session-manager.ts (0.95), jwt-utils.ts (0.85)
  REFINE: 足够的上下文 (2 high-relevance files)

Result: auth.ts, tokens.ts, session-manager.ts, jwt-utils.ts

示例 2: 功能实现

code

Task: "添加 API 端点的速率限制"

Cycle 1:
  DISPATCH: 在 routes/** 中搜索 "rate", "limit", "api"
  EVALUATE: 无匹配 - 代码库使用 "throttle" 术语
  REFINE: 添加 "throttle", "middleware" 关键字

Cycle 2:
  DISPATCH: 搜索优化后的术语
  EVALUATE: 找到 throttle.ts (0.9), middleware/index.ts (0.7)
  REFINE: 需要 router 模式

Cycle 3:
  DISPATCH: 搜索 "router", "express" 模式
  EVALUATE: 找到 router-setup.ts (0.8)
  REFINE: 足够的上下文

Result: throttle.ts, middleware/index.ts, router-setup.ts

与 Agents 集成

在 agent prompts 中使用：

markdown

当为此任务检索上下文时：
1. 从广泛的关键字搜索开始
2. 评估每个文件的相关性 (0-1 等级)
3. 识别仍然缺失的上下文
4. 优化搜索条件并重复（最多 3 个周期）
5. 返回相关性 >= 0.7 的文件

最佳实践

•从宽泛开始，逐步缩小 - 不要过度指定初始查询
•学习代码库术语 - 第一个周期通常会揭示命名约定
•跟踪缺失内容 - 明确的缺口识别驱动优化
•在“足够好”时停止 - 3 个高相关性文件胜过 10 个平庸的
•自信地排除 - 低相关性文件不会变得相关