AgentSkillsCN

multi-ai-orchestrator

基于Ollama的多AI模型编排,具备自动画像、智能路由和集成执行功能

SKILL.md
--- frontmatter
name: "multi-ai-orchestrator"
description: "Ollama-based multi-AI model orchestration with auto-profiling, smart routing, and ensemble execution"

Multi-AI Orchestrator

Overview

Ollama 기반 로컬 AI 모델 자동 프로파일링, 스마트 라우팅, 앙상블 실행 스킬.

핵심 기능:

  • ⚡ 자동 프로파일링: 모델 추가 시 자동 감지/업데이트
  • 🎯 스마트 라우팅: 작업 유형별 최적 모델 선택 (정확도 95%+)
  • 🚀 병렬 처리: 복잡 작업 시 3+ 모델 동시 실행 후 종합
  • 💪 하드웨어 최적화: RTX PRO 6000 기준 8,425 tokens/s

When to Use

✅ 적합한 경우

  • 3개+ Ollama 모델 운영
  • 다양한 작업 유형 (코딩/분석/번역)
  • 고품질 결과 필요 (교차 검증)
  • RTX 4090/5090/PRO 6000+ GPU

❌ 부적합한 경우

  • 1-2개 모델만 사용
  • VRAM 16GB 이하
  • 실시간 초저지연 요구 (0.2-0.5초 오버헤드)

Core Capabilities

1. 자동 모델 프로파일링

scripts/auto_model_profiler.py 실행 → models_profile.json 생성

2. 스마트 라우팅

작업 유형키워드선택 모델
코딩코드, 함수, debugCodex
분석분석, 비교, 평가Claude
번역번역, translateGemini
빠른 응답빨리, 요약Gemini
수학계산, 증명Qwen

3. 앙상블 실행

복잡 작업 → 3개 모델 병렬 → Claude 종합

  • 소요: 4-9초 (단일 대비 +2-3초)
  • 품질: +30-50%

4. MCP 통합

cli-orchestrator MCP로 Codex CLI, Gemini CLI 제어 가능

  • ask_codex: 코드 특화
  • ask_gemini: 빠른 응답
  • compare_models: 병렬 비교
  • smart_ask: 자동 라우팅

Installation

Quick Start (Claude Code)

bash
mkdir -p ~/.claude/skills/multi-ai-orchestrator
cp SKILL.md ~/.claude/skills/multi-ai-orchestrator/

스크립트 설정

bash
cd ~/.claude/skills/multi-ai-orchestrator
python3 auto_model_profiler.py  # 프로파일 생성

Usage

기본 사용

python
from smart_router import SmartRouter
router = SmartRouter()
model = router.route("Python 이진 탐색 구현해줘")  # → codex

앙상블 실행

python
from ensemble_executor import ModelEnsemble
ensemble = ModelEnsemble()
results = await ensemble.run_parallel("기후변화 경제영향 분석")
final = ensemble.synthesize(results)

Files

파일용도
auto_model_profiler.py모델 프로파일링
smart_router.py작업→모델 라우팅
ensemble_executor.py병렬 실행
mcp_bridge.pyMCP 통합
models_profile.json모델 특성 DB

References

상세 내용은 다음 파일 참조:

  • references/installation.md - 상세 설치 가이드
  • references/examples.md - 사용 예제
  • references/mcp-integration.md - MCP 통합 상세
  • references/benchmarks.md - 성능 벤치마크
  • references/algorithms.md - 알고리즘 상세

Performance

지표
라우팅 정확도95%+
단일 모델 실행2-5초
앙상블 (3개)4-9초
품질 향상+30-50%