AgentSkillsCN

model-router

基于基准数据的智能任务到模型路由。根据任务类型及各模型的优势,将任务路由至 Claude Code 或 Codex CLI。此功能于 v8.0 新增。

SKILL.md
--- frontmatter
name: model-router
description: |
  Intelligent task-to-model routing based on benchmark data.
  Routes tasks to Claude Code or Codex CLI based on task type
  and model strengths. New in v8.0.

Model Router Skill

路由矩阵

基于 2026-02 Benchmark 数据驱动的路由决策:

任务类型首选理由降级
终端密集型操作CodexTerminal-Bench 77.3% > 65.4%Claude
复杂 Bug 诊断ClaudeOpenRCA 34.9%, 推理更深Codex
多语言代码修复CodexSWE-Bench Pro 领先,token 更省Claude
架构设计/评审ClaudeARC AGI 68.8%, 推理深度不降级
前端 UI 实现Codex25%更快 + chrome-devtoolsClaude
文档/知识工作ClaudeGDPval-AA 1606 Elo不降级
安全审查双引擎两者互补单引擎
长上下文任务ClaudeMRCR v2 76% vs 18.5%拆分任务

自动路由逻辑

code
任务输入 → 分类
  │
  ├─ 涉及终端/脚本/CLI?
  │   → Codex CLI
  │
  ├─ 涉及前端 UI + 需要实时调试?
  │   → Codex CLI (chrome-devtools)
  │
  ├─ 涉及架构决策/复杂推理?
  │   → Claude Code (effort=max)
  │
  ├─ 涉及文档/分析/知识工作?
  │   → Claude Code
  │
  ├─ 涉及安全审查?
  │   → 双引擎并行 (Agent Teams)
  │
  └─ 其他?
      → 当前平台默认

交叉验证模式

vibe-verify --cross 触发:

code
Claude 实现 → Codex 审查 → 差异报告
Codex 实现 → Claude 审查 → 差异报告

利用模型差异化能力提高缺陷发现率。

降级策略

条件动作
目标模型不可用使用当前平台继续
连续 2 次执行失败切换到备选模型
API 限流队列等待或降级

所有降级决策记录到 .ai_state/decisions.md