Search Enhancer - Codex Multi-Agent Skill
这是一份给 Codex/多 AI 协作 用的“渐进式 AIskill”说明(指导怎么把“模糊问题 -> 可执行的搜索 -> 可追溯的证据链输出”)。
它不是运行时业务 skill(不是 skills/* 那种)。
渐进式工作流(Progressive)
Level 0:只做“把问题问清楚”
目标:用最少问题把需求变成可搜索、可验证的任务。
只问 1-2 个关键澄清问题(避免 10 连问):
- •目标:科普/技术实现/学术/购物对比/最新动态?
- •时间范围:要“最新(近 3-6 个月)”还是“原理类不需要最新”?
- •输出形式:要结论摘要,还是要带引用/链接证据?
Level 1:给出查询计划(不跑浏览器也行)
产出:
- •选择 goal:
auto | popular | academic | shopping | technical+ 理由 - •2-3 个查询串(中文/英文/同义词)
- •可信来源优先级(docs/papers/官方/百科/论坛等)
Level 2:执行多轮搜索 + 结构化审计日志
目标:能复盘“为什么这么搜、哪一轮最好、证据来自哪里”。
优先用本 repo 的 TS 集成 adaptiveSearch(带 audit logs),并把日志落到可检索的位置。
关键增强:不要把搜索当数据库(要“适度点开验证”)
很多 SERP(搜索结果页)标题/摘要不完整,甚至标题缺失或很“正常/泛”,但点进详情页才有关键内容。 因此:拿到搜索结果后,要用有限预算“点开一部分结果”做验证与补漏,再决定结论与证据。
点击/打开的原则(Click-through budget):
- •每轮至少打开
2个结果(必要时提高到3-5),并包含 1 个“不确定但可能有料”的结果(避免只点“看起来最像答案”的)。 - •标题缺失/很泛(如“首页/详情/正文”)时,改用
域名 + URL 路径 + 摘要片段决策是否点开。 - •追求“证据面”而非“命中率”:优先覆盖不同来源类型(官方文档/论文/新闻/论坛/代码仓库)。
在本 repo 里怎么做(可直接复制):
- •用平台 skill 跑
adaptive_search_skill,开启详情页打开:- •
--set details=2(或更高) - •建议同时开启截图:
--set openScreenshotPrefix="...\\screenshots\\open"(便于后续 AI/人复盘)
- •
- •对少量关键链接做“截图 + HTML”取证(当需要看页面结构/内容而不是只看摘要):
- •用
rpa_ts_skill的action=inspectPage获取*_screenshot.png+*_page.html+*_a11y.aria.yml+*_elements.json - •让 AI 基于截图与 HTML 做内容判断(例如:是否有关键段落/表格、是否被重定向、是否是广告页/聚合页)
- •用
本 repo 中的代码落点(Where)
搜索能力来自迁移进来的 TypeScript 集成:
- •
integrations/rpaskill_ts/src/skills/adaptiveSearch.ts - •
integrations/rpaskill_ts/src/skills/webSearch.ts - •runner:
integrations/rpaskill_ts/cli/run.mjs
平台提供的“一等公民 skill 封装”(Python):
- •
skills/adaptive_search_skill/(封装 TSadaptiveSearch) - •
skills/web_search_skill/(封装 TSwebSearch) - •公共 runner bridge:
skills/rpa_ts_skill/common/runner.py
多 AI 协作协议(No Locks Yet)
没有锁时,核心原则:默认只写 agent 私有目录,共享目录只让“协调者 agent”写。
约定:
- •协调者(coordinator):负责最终 query plan、最终输出、共享记忆写入
- •执行者(worker):负责跑某一轮搜索/开链接摘要/整理候选证据(写私有目录)
运行时目录(由平台生成):
code
outputs/<skill>/<run_id>/
shared/
agents/<agent_id>/
work/
events.jsonl
memory.jsonl
index.jsonl
记录要求(AI 友好检索):
- •
events.jsonl:每轮搜索、决策点、结果摘要(可过滤 event/round) - •
memory.jsonl:只写短“事实/决策”,大内容写 artifact 文件再引用路径 - •
index.jsonl:产物索引(路径/hash/大小)
执行方式(How)
方式 A:走平台 skill(推荐,日志/产物统一)
code
python run.py --skill adaptive_search_skill --root . --run-id demo --agent agent0 python run.py --skill web_search_skill --root . --run-id demo --agent agent1
方式 B:直接跑 TS runner(适合调试 TS 层)
在 integrations/rpaskill_ts/:
- •
npm install - •
node cli/run.mjs --action adaptiveSearch --input <config.json> --output <out.json>
输出标准(What To Output)
无论用哪种方式,最终输出应包含:
- •goal(选了什么 + 为什么)
- •最佳轮次(best round)摘要
- •3-5 条最关键证据(标题+来源域名+链接),优先来自“点开后的详情页”而非仅 SERP
- •复盘信息:搜索关键词/过滤条件/迭代原因(来自 events/memory)