LLM API 문서 수집 스킬 (Playwright MCP)
LLM API의 공식 문서를 Playwright MCP를 사용하여 정확하게 수집하고 마크다운으로 정리합니다.
When to Use This Skill
다음과 같은 요청이 들어올 때 이 스킬을 활성화하세요:
- •"Gemini API 문서 가져와줘"
- •"Claude 최신 모델 정보 알려줘"
- •"Grok API 가격 정리해줘"
- •"OpenAI GPT 모델 목록 가져와"
- •"LLM API 문서 수집해줘"
- •"{LLM이름} API 최신 정보"
Prerequisites Check (CRITICAL)
스킬 실행 전 반드시 Playwright MCP 설치 여부를 확인하세요:
Step 1: MCP 도구 확인
code
mcp__playwright__browser_snapshot 도구가 사용 가능한지 확인
Step 2: 설치되지 않은 경우
- •프로젝트 루트에
.mcp.json파일 생성:
json
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["-y", "@playwright/mcp@latest"]
}
}
}
- •사용자에게 안내:
code
Playwright MCP가 설치되어 있지 않습니다. 설치 방법: 1. 위의 .mcp.json 파일이 프로젝트 루트에 생성되었습니다. 2. Claude Code를 재시작해주세요 (Ctrl+Shift+P → "Developer: Reload Window") 3. 재시작 후 다시 요청해주세요.
- •브라우저 미설치 오류 시:
bash
npx playwright install chromium
Your Task
1. LLM 이름 파싱
사용자 입력에서 LLM 이름 추출:
- •Gemini / Google AI
- •Claude / Anthropic
- •Grok / xAI
- •GPT / OpenAI
- •Llama / Meta
2. 공식 문서 URL 매핑
| LLM | 문서 URL | 수집 대상 |
|---|---|---|
| Gemini | https://ai.google.dev/gemini-api/docs/models | 모델, 가격, 기능 |
| Claude | https://docs.anthropic.com/en/docs/about-claude/models/all-models | 모델, 가격, 기능 |
| Grok | https://docs.x.ai/docs/models | 모델, 가격, 기능, Rate Limits |
| OpenAI | https://platform.openai.com/docs/models | 모델, 가격, 기능 |
3. Playwright MCP로 페이지 수집
각 페이지에 대해:
code
1. browser_navigate → URL 이동 2. browser_wait_for → 페이지 로드 대기 (2-3초) 3. browser_snapshot → DOM 스냅샷 캡처 4. 필요시 browser_click → 탭/섹션 확장 5. browser_close → 브라우저 닫기
4. LLM별 스크래핑 전략
Grok (docs.x.ai)
- •동적 테이블 렌더링 대기 필수
- •"Loading models..." 텍스트가 사라질 때까지 대기
- •Rate Limits, Pricing 섹션 별도 확인
Gemini (ai.google.dev)
- •모델 테이블이 여러 섹션으로 분리됨
- •Pricing 페이지 별도: https://ai.google.dev/gemini-api/docs/pricing
Claude (docs.anthropic.com)
- •모델 정보와 가격이 다른 페이지
- •Pricing: https://www.anthropic.com/pricing
OpenAI (platform.openai.com)
- •로그인 없이 접근 가능한 공개 문서만 수집
- •Models 페이지에서 주요 정보 확인
Output Format
마크다운 구조
markdown
# {LLM} API 최신 문서 정보
## 개요
{LLM 간단 설명}
---
## 사용 가능한 모델
| 모델 | Model ID | 컨텍스트 | Max Output | 특징 |
|------|----------|----------|------------|------|
| ... | ... | ... | ... | ... |
---
## 가격 정책 (100만 토큰당, USD)
| 모델 | Input | Output | 비고 |
|------|-------|--------|------|
| ... | ... | ... | ... |
---
## 주요 기능
| 기능 | 설명 |
|------|------|
| ... | ... |
---
## SDK 사용 예시
```python
# 코드 예시
공식 리소스
- •API 문서: {URL}
- •가격 정보: {URL}
- •릴리스 노트: {URL}
문서 수집일: YYYY-MM-DD | 출처: 공식 문서
code
## Error Handling
### 페이지 로드 실패
- 3초 대기 후 재시도
- 재시도 실패 시 WebSearch로 대체 정보 수집
- 사용자에게 부분 결과 + 오류 알림
### 동적 콘텐츠 미로드
- browser_wait_for로 특정 텍스트 대기
- 최대 10초 대기
- 타임아웃 시 현재 상태로 진행
### 접근 차단 (403/Rate Limit)
- WebSearch로 캐시된 정보 검색
- 대체 소스 (llm-stats.com, openrouter.ai) 활용
- 결과에 "일부 정보는 대체 소스에서 수집됨" 표시
## File Output
### 저장 위치
`{프로젝트 루트}/{llm_name}_api_docs_{YYYYMMDD}.md`
### 예시
- `gemini_api_docs_20260108.md`
- `claude_api_docs_20260108.md`
- `grok_api_docs_20260108.md`
## After Completion
1. 수집된 정보를 마크다운 테이블로 표시
2. 파일 저장 완료 메시지
3. 수집 성공률 표시 (예: "4개 섹션 중 4개 수집 완료")
4. 공식 문서 링크 제공
5. 브라우저 닫기 확인
## Example Workflow
사용자: "Grok API 문서 가져와줘"
1. [체크] Playwright MCP 설치 확인 ✓
2. [이동] https://docs.x.ai/docs/models
3. [대기] 페이지 로드 완료 (2초)
4. [캡처] browser_snapshot으로 DOM 추출
5. [파싱] 모델 테이블, 가격, Rate Limits 추출
6. [저장] grok_api_docs_20260108.md 생성
7. [출력] 마크다운 테이블로 결과 표시
8. [종료] 브라우저 닫기
완료: "Grok API 문서를 수집했습니다. 10개 모델 정보가 grok_api_docs_20260108.md에 저장되었습니다."
## Notes
- WebFetch는 동적 페이지에서 실패할 수 있음 → Playwright MCP 우선 사용
- 가격 정보는 자주 변경되므로 수집일자 표시 필수
- 공식 문서 URL이 변경될 수 있으므로 실패 시 WebSearch로 최신 URL 확인