迭代检索(Iterative Retrieval)

高级 Advanced 流程型 Process ⚡ Claude Code 专属 ⚡ Claude Code Optimized
4 min read · 208 lines

渐进式上下文检索,三轮迭代精准定位相关代码

迭代检索(Iterative Retrieval)

概述

迭代检索是一种渐进式上下文检索模式,用于解决多代理工作流中的"子代理上下文问题"。子代理在被创建时上下文有限,不知道需要哪些文件,迭代检索通过"分发-评估-精炼-循环"四阶段流程逐步精炼搜索条件,在最多 3 轮迭代内找到最相关的代码上下文。

二、解决方案:迭代检索

一个四阶段循环,逐步精炼上下文:

+---------------------------------------------+
|                                             |
|   +----------+      +----------+            |
|   | 分发     |----->| 评估     |            |
|   | DISPATCH |      | EVALUATE |            |
|   +----------+      +----------+            |
|        ^                  |                 |
|        |                  v                 |
|   +----------+      +----------+            |
|   | 循环     |<-----| 精炼     |            |
|   |   LOOP   |      |  REFINE  |            |
|   +----------+      +----------+            |
|                                             |
|        最多 3 轮循环,然后继续               |
+---------------------------------------------+

阶段 1:分发(DISPATCH)

初始广泛查询以收集候选文件:

// 从高层意图出发
const initialQuery = {
  patterns: ['src/**/*.ts', 'lib/**/*.ts'],
  keywords: ['authentication', 'user', 'session'],
  excludes: ['*.test.ts', '*.spec.ts']
};

// 分发给检索代理
const candidates = await retrieveFiles(initialQuery);

阶段 2:评估(EVALUATE)

评估检索内容的相关性:

function evaluateRelevance(files, task) {
  return files.map(file => ({
    path: file.path,
    relevance: scoreRelevance(file.content, task),      // 相关性评分
    reason: explainRelevance(file.content, task),        // 相关性原因
    missingContext: identifyGaps(file.content, task)     // 缺失的上下文
  }));
}

评分标准:

等级 分数范围 说明
0.8-1.0 直接实现目标功能
0.5-0.7 包含相关模式或类型
0.2-0.4 间接相关
0-0.2 不相关,排除

阶段 3:精炼(REFINE)

根据评估结果更新搜索条件:

function refineQuery(evaluation, previousQuery) {
  return {
    // 添加在高相关性文件中发现的新模式
    patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],

    // 添加在代码库中发现的术语
    keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],

    // 排除确认不相关的路径
    excludes: [...previousQuery.excludes, ...evaluation
      .filter(e => e.relevance < 0.2)
      .map(e => e.path)
    ],

    // 针对特定空白区域
    focusAreas: evaluation
      .flatMap(e => e.missingContext)
      .filter(unique)
  };
}

阶段 4:循环(LOOP)

使用精炼后的条件重复查询(最多 3 轮):

async function iterativeRetrieve(task, maxCycles = 3) {
  let query = createInitialQuery(task);
  let bestContext = [];

  for (let cycle = 0; cycle < maxCycles; cycle++) {
    const candidates = await retrieveFiles(query);
    const evaluation = evaluateRelevance(candidates, task);

    // 检查是否有足够的上下文
    const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
    if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
      return highRelevance;
    }

    // 精炼并继续
    query = refineQuery(evaluation, query);
    bestContext = mergeContext(bestContext, highRelevance);
  }

  return bestContext;
}

三、实际示例

示例 1:Bug 修复上下文

任务: "修复身份认证令牌过期的 Bug"

第 1 轮:
  分发: 在 src/** 中搜索 "token", "auth", "expiry"
  评估: 找到 auth.ts (0.9), tokens.ts (0.8), user.ts (0.3)
  精炼: 添加 "refresh", "jwt" 关键词; 排除 user.ts

第 2 轮:
  分发: 使用精炼后的条件搜索
  评估: 找到 session-manager.ts (0.95), jwt-utils.ts (0.85)
  精炼: 上下文充足(2 个高相关性文件)

结果: auth.ts, tokens.ts, session-manager.ts, jwt-utils.ts

示例 2:功能实现

任务: "为 API 端点添加速率限制"

第 1 轮:
  分发: 在 routes/** 中搜索 "rate", "limit", "api"
  评估: 没有匹配 -- 代码库使用 "throttle" 术语
  精炼: 添加 "throttle", "middleware" 关键词

第 2 轮:
  分发: 使用精炼后的条件搜索
  评估: 找到 throttle.ts (0.9), middleware/index.ts (0.7)
  精炼: 需要路由模式

第 3 轮:
  分发: 搜索 "router", "express" 模式
  评估: 找到 router-setup.ts (0.8)
  精炼: 上下文充足

结果: throttle.ts, middleware/index.ts, router-setup.ts

四、在代理提示中使用

为此任务检索上下文时:
1. 从广泛的关键词搜索开始
2. 评估每个文件的相关性(0-1 分)
3. 识别仍然缺失的上下文
4. 精炼搜索条件并重复(最多 3 轮)
5. 返回相关性 >= 0.7 的文件

五、最佳实践

  1. 从宽到窄,逐步缩小 -- 不要在初始查询中过度指定
  2. 学习代码库术语 -- 第一轮循环通常会揭示命名约定
  3. 追踪缺失内容 -- 明确的空白识别驱动精炼
  4. 在"足够好"时停止 -- 3 个高相关性文件胜过 10 个平庸文件
  5. 自信地排除 -- 低相关性文件不会变成高相关性文件

相关技能 Related Skills