AgentSkillsCN

data-collection-guide

第二章 数据采集质量标准与验证方法

SKILL.md
--- frontmatter
name: data-collection-guide
description: "Chapter 2 데이터 수집 품질 기준 및 검증 방법"

Chapter 2 데이터 수집 품질 기준

이 문서는 Chapter 2 작성을 위한 데이터 수집의 품질 기준과 검증 방법을 제공한다.


1. 출처 신빙성 기준

1.1 출처 등급 분류

등급출처 유형예시신뢰도
A글로벌 조사기관IDC, Gartner, MarketsandMarkets, Frost & Sullivan최상
A정부/공공기관특허청, 산업부, 과기부, NTIS최상
B공인 연구기관KISTEP, KIET, KEIT, ETRI
B학술 논문IEEE, Nature, Science, ACM
C기업 공식 자료IR 자료, 연례보고서, 보도자료중상
D전문 매체ZDNet, TechCrunch, 전자신문
E일반 매체종합 일간지, 경제지중하
F비공식 자료개인 블로그, 위키사용금지

1.2 출처별 활용 기준

yaml
market_data:
  required_grade: "A 또는 B"
  minimum_sources: 2
  note: "시장 규모 데이터는 반드시 글로벌 조사기관 출처 필요"

company_info:
  required_grade: "B 이상"
  minimum_sources: 1
  note: "기업 정보는 공식 자료(C등급) 허용"

technology_trend:
  required_grade: "B 이상"
  minimum_sources: 2
  note: "기술 동향은 연구기관 또는 학술 자료 우선"

patent_data:
  required_grade: "A"
  minimum_sources: 1
  note: "특허 데이터는 공식 특허DB만 사용"

2. 데이터 최신성 기준

2.1 연도별 기준

데이터 유형권장 연도최대 허용 연도
시장 규모2024-20252023
기술 동향2024-20252023
기업 현황2024-20252023
특허 분석2019-2024 (5년간)2018-2024
정책 자료2024-20252022

2.2 예외 사항

code
[최신성 예외 허용 케이스]
1. 역사적 기술 발전 설명 시
2. 장기 시장 추세 분석 시
3. 기존 기술 대비 신기술 비교 시
4. 정책 연혁 설명 시

3. 데이터 완결성 기준

3.1 시장 데이터 필수 항목

yaml
domestic_market:
  required:
    - current_size: "현재 시장 규모 (년도, 금액, 단위)"
    - cagr: "연평균 성장률"
    - forecast: "전망 규모 (목표 년도, 금액)"
    - source: "출처 (기관명, 보고서명, 년도)"
  optional:
    - segment_breakdown: "세부 시장 분류"
    - key_players: "주요 기업"

global_market:
  required:
    - current_size: "글로벌 시장 규모"
    - cagr: "연평균 성장률"
    - forecast: "전망 규모"
    - regional_share: "지역별 점유율"
    - source: "출처"
  optional:
    - industry_breakdown: "산업별 분류"
    - country_breakdown: "국가별 분류"

3.2 기업 데이터 필수 항목

yaml
company_profile:
  required:
    - name: "기업명"
    - products_services: "주요 제품/서비스"
    - achievement: "성과 또는 특징"
  optional:
    - revenue: "매출"
    - market_share: "시장 점유율"
    - recent_news: "최근 동향"

3.3 특허 데이터 필수 항목

yaml
patent_analysis:
  required:
    - yearly_trend: "연도별 출원 동향 (최소 5년)"
    - country_share: "국가별 비중 (최소 4개국)"
    - domestic_key_patents: "국내 핵심 특허 (4-5건)"
    - global_key_patents: "국외 핵심 특허 (10-15건)"
  optional:
    - technology_classification: "기술별 분류"
    - top_applicants: "다출원인 분석"
    - os_matrix: "공백기술 분석"

3.4 경쟁력 비교표 필수 항목

yaml
competitiveness_table:
  required:
    - depth1: "영역 (3-5개)"
    - depth2: "기술 (영역당 2-3개)"
    - benchmark_institution: "선진기관명"
    - country: "국가"
    - benchmark_level: "선진기관 기술수준"
    - kimm_current: "KIMM 현재 수준"
    - kimm_target: "KIMM 목표 수준"

4. 데이터 정합성 검증

4.1 내부 정합성 체크리스트

markdown
[시장 데이터 정합성]
- [ ] 시장 규모 단위 일관성 (달러/원화)
- [ ] CAGR 계산 검증 (현재 규모와 전망 규모 일치)
- [ ] 지역별 점유율 합계 100% 확인
- [ ] 산업별 분류 합계 검증

[기업 데이터 정합성]
- [ ] 기업명 표기 일관성 (영문/한글)
- [ ] 성과 데이터 단위 일관성
- [ ] 연도 표기 일관성

[특허 데이터 정합성]
- [ ] 연도별 출원 건수 합계 검증
- [ ] 국가별 비중 합계 100% 확인
- [ ] 핵심 특허 정보 완결성 확인

4.2 외부 정합성 체크리스트

markdown
[Chapter 간 정합성]
- [ ] Chapter 3 세부기술 ↔ Chapter 2 기술 동향 일치
- [ ] Chapter 3 최종목표 ↔ Chapter 2 기술개발 방향 연계
- [ ] Chapter 1 정책 부합성 ↔ Chapter 2 시사점 연계
- [ ] Chapter 1 기술분류 ↔ Chapter 2 기술 동향 일치

5. 테이블 작성 기준

5.1 기업 동향 테이블

항목기준
국내 기업최소 5개
글로벌 기업최소 10개
필수 열기업명, 제품/서비스, 성과
선택 열매출, 점유율, 특이사항
markdown
[예시]
| 기업명 | 주요 서비스/제품 | 성과 및 전망 |
|--------|-----------------|-------------|
| 삼성SDS | '패브릭스', '브리티 코파일럿' | 2분기 영업이익 2209억원 (전년 대비 7.1% 증가) |
| SK C&C | '솔루어', 'AI 랜딩존' | 2분기 영업이익 전년 대비 13.78% 증가 |
| LG CNS | 'GenAI Text' | 2분기 영업이익 1377억원 (전년 대비 21.0% 증가) |

5.2 M&A 동향 테이블

항목기준
최소 건수5건
필수 열인수사, 피인수사, 유형, 기대효과, 시기
연도 범위최근 3년 (2022-2024)
markdown
[예시]
| 회사 | 인수/합병 회사 | 유형 | 기대효과 | 시기 |
|-----|--------------|------|---------|-----|
| 지멘스 | Altair Engineering | 인수 | AI 기반 설계/시뮬레이션 포트폴리오 강화 | 2024 |
| 오토데스크 | Wonder Dynamics | 인수 | 클라우드 기반 AI 콘텐츠 제작 효율화 | 2024 |

5.3 특허 분석 테이블

항목기준
연도별 동향최소 5년
국가별 비중최소 4개국
국내 핵심 특허4-5건
국외 핵심 특허10-15건
markdown
[예시 - 국가별 비중]
| 국가 | 비중 |
|------|------|
| 미국 | 44% |
| 일본 | 15% |
| 중국 | 12% |
| 한국 | 8% |
| 기타 | 21% |

5.4 경쟁력 비교표

항목기준
영역(Depth 1)3-5개
기술(Depth 2)영역당 2-3개
기술수준 표기TRL 1-9 또는 점수 1-5
markdown
[예시]
| Depth 1 | Depth 2 | 선진기관 | 국가 | 기술수준 | KIMM 현재 | KIMM 목표 |
|---------|---------|---------|-----|---------|----------|----------|
| 설계 기술 | 기계요소부품 설계 | FZG | 독일 | 5 | 2 | 4 |
| | 진동/충격 저감장치 설계 | [대기업A] | 한국 | 5 | 4 | 4 |
| 해석 기술 | 3D 기반 부품 해석기술 | ANSYS | 미국 | 5 | 2 | 4 |

6. 이미지 위치 기준

6.1 필수 이미지 목록

번호이미지명위치유형
1국내 시장 규모 및 전망1. 국내 시장막대/선 그래프
2국내 주요 기업 동향1. 국내 시장테이블
3국산 SW/제품 시장 현황1. 국내 시장막대 그래프
4글로벌 시장 규모2. 국외 시장막대/선 그래프
5지역별 시장 점유율2. 국외 시장파이 차트
6연도별 특허 출원 동향2. 국외 시장막대 그래프
7국가별 특허 비중2. 국외 시장파이 차트
8기술별 특허 분류2. 국외 시장막대 그래프
9글로벌 기업 동향2. 국외 시장테이블
10M&A 동향2. 국외 시장테이블
11연구원 경쟁력 비교표3. 시사점테이블

6.2 이미지 표기 형식

markdown
<이미지 설명>

또는 (출처 포함)

<이미지 설명>
> 출처: 기관명, 보고서명, 연도

7. 수치 표기 기준

7.1 시장 규모

규모표기 형식
100억 원 미만XX억 원
100억 원 이상X,XXX억 원
1조 원 이상X조 X,XXX억 원
달러XX억 달러 / XX백만 달러

7.2 성장률

code
CAGR XX% 또는 연평균 XX% 성장

7.3 점유율

code
XX% (소수점 1자리까지)

7.4 TRL

code
TRL X (1-9 정수)

8. 검증 절차

Step 1: 데이터 수집 완료 후

  1. 모든 데이터에 출처 확인
  2. 출처 등급 확인 (B등급 이상)
  3. 데이터 최신성 확인 (2023년 이후)

Step 2: 테이블 작성 후

  1. 필수 항목 완결성 확인
  2. 단위 일관성 확인
  3. 합계/비율 검증

Step 3: 문서 작성 후

  1. Chapter 간 정합성 확인
  2. 이미지 위치 확인
  3. 출처 표기 확인

Step 4: 최종 검토

markdown
[최종 검증 체크리스트]
- [ ] 모든 수치 데이터에 출처 명시
- [ ] 시장 규모 데이터 최신성 (2023년 이후)
- [ ] 기업 동향 테이블 완결성 (국내 5+, 글로벌 10+)
- [ ] 특허 분석 완결성 (연도별, 국가별, 국내 특허 4-5건, 국외 특허 10-15건)
- [ ] 경쟁력 비교표 완결성 (영역 3-5개, 기술 6-15개)
- [ ] Chapter 1/3과 정합성 확인
- [ ] 강조 표시(**, 이모지) 없음 확인

Meta

yaml
version: "1.0"
created: "2026-01-30"
consumers:
  - chapter2