다음 단계 노트북 생성 (generate-next-step)
동작
- •
reports/pipeline_context.json→current_step확인 - •해당 step의 참조 파일 읽기
- •노트북 생성
파이프라인
| current_step | 생성할 파일 | 참조 |
|---|---|---|
preprocess | 02_preprocessing.ipynb | preprocessing_guide.md |
viz | 03_visualization.ipynb | step2 결과 |
state_analysis | 04_state_analysis.ipynb | stats.md |
writing | step5_draft_method.md, step5_draft_results.md | writing.md |
proofreading | step6_proofreading_report.md | proofreading_guide.md |
revision | step7_revised_method.md, step7_revised_results.md | revision.md |
Step 2: Preprocessing
참조
- •
guides/preprocessing_guide.md(점수 계산 공식)
분석 순서
- •QC: 응답 부족(10개 미만), Straight-lining 제외
- •Big Five: superKey696.csv로 NEO_O, NEO_C, NEO_E, NEO_A, NEO_N 계산
- •Ideology: z(MPQtr) + z(NEOo6)*-1 의 평균
- •Honesty-Humility: z(NEOa2) + z(NEOa4) + z(HEXACO_H) 의 평균
- •저장: data/processed/sapa_scores.csv
출력할 내용
- •QC 결과 (제외 인원, 유효 N)
- •각 척도별 N, Mean, SD
Step 3: Visualization
참조
- •
reports/step2_preprocess.json(계산된 척도 목록)
분석 순서
- •상관행렬: 7개 척도 간 상관 히트맵, pairwise N 확인
- •분포: Big Five 히스토그램, Ideology/H-H 히스토그램
출력할 내용
- •상관행렬 PNG
- •분포 히스토그램 PNG
- •주요 상관관계 수치
Step 4: State Analysis
참조
- •
guides/stats.md(Critical Ratios 방법론)
분석 순서
- •데이터 준비: state 변수 병합, "other" 제외 (9개 주만)
- •기술통계: State × 척도별 N, Mean, SE
- •Critical Ratios: CR = (State Mean - Grand Mean) / SE
- •유의미 판정: |CR| > 3.0 → 유의미 (p < .003)
출력할 내용
- •State별 표본 수
- •유의미한 특징 목록 (State, 척도, CR값, 방향)
- •히트맵 PNG
Step 5: Writing
참조
- •
guides/writing.md(JSON 경로 매핑, 글쓰기 원칙)
작성 순서
- •step1~4 JSON 파일 읽기
- •writing.md의 경로 매핑 참조하여 값 추출
- •Method/Results 초안 생성
출력할 내용
- •
reports/step5_draft_method.md - •
reports/step5_draft_results.md
노트북 공통 규칙
- •첫 셀:
%pip install(필요한 패키지) - •작업 디렉토리: notebooks에서 실행 시 상위로 이동
- •상대 경로만 사용
주의사항
z-score 계산 시 Index 유지
Ideology, H-H 계산 시 z-score를 DataFrame에 할당할 때 반드시 index를 유지해야 합니다.
python
# ❌ 잘못된 방법 (NaN 전체 발생) z_mpqtr = stats.zscore(scores['MPQ_Traditionalism'].values) scores['Ideology'] = (z_mpqtr + z_neo_lib * -1) / 2 # ✅ 올바른 방법 (pd.Series로 index 유지) valid_mask = scores['MPQ_Traditionalism'].notna() & scores['NEO_Liberalism'].notna() mpqtr_valid = scores.loc[valid_mask, 'MPQ_Traditionalism'] z_mpqtr = pd.Series(stats.zscore(mpqtr_valid.values), index=mpqtr_valid.index)
컬럼명 규칙
Big Five 컬럼은 약어 사용: NEO_O, NEO_C, NEO_E, NEO_A, NEO_N
- •❌
NEO_Openness→ KeyError 발생 - •✅
NEO_O
커널 재시작
이전 노트북 수정 후 다음 노트북을 확인할 때는 커널을 재시작해야 합니다.
Writing Step 전제조건
step1~step4 JSON 파일이 모두 존재해야 writing step 실행 가능.
Step 6: Proofreading
참조
- •
guides/proofreading_guide.md(평가 기준, Few-shot 예시, 템플릿) - •
reports/step5_draft_method.md(평가 대상) - •
reports/step5_draft_results.md(평가 대상)
평가 순서
- •Methods 평가: 5가지 기준 (Reproducibility, Controls, Sample size, Statistical appropriateness, Validation)
- •Results 평가: 각 문장별 Claim type, Evidence level, Overclaiming risk
- •Top 3 Overclaim 식별: 가장 위험한 문장 3개와 수정안
- •종합 보고서 작성: Must Fix / Should Fix / Nice to Have 분류
출력할 내용
- •
reports/step6_proofreading_report.md
전제조건
- •step5_draft_method.md 존재
- •step5_draft_results.md 존재
Step 7: Revision
참조
- •
reports/step5_draft_method.md(원본 Method 초안) - •
reports/step5_draft_results.md(원본 Results 초안) - •
reports/step6_proofreading_report.md(프루프리딩 평가 및 수정 사항)
수정 순서
- •프루프리딩 보고서의 "필수 수정 사항 (Must Fix)" 확인
- •Methods 섹션 수정 (재현성, 통제, 검정력, 통계 적절성, 타당성)
- •Results 섹션 수정 (overclaiming 완화, 표현 보수화)
- •"수정 전후 비교" 섹션의 수정안 반영
출력할 내용
- •
reports/step7_revised_method.md - •
reports/step7_revised_results.md
Revision 전제조건
- •step5_draft_method.md 존재
- •step5_draft_results.md 존재
- •step6_proofreading_report.md 존재