Research Critical Thinking

統合スキル: このスキルは scientific-critical-thinking をベースに拡張したものです。

概要

批判的思考と科学的評価のツールキット。科学的主張の妥当性評価、バイアス検出、研究品質評価を提供。

主な機能:

•科学的主張の評価フレームワーク
•バイアス・交絡の検出
•エビデンス階層（GRADE, Cochrane）の適用
•研究デザインの妥当性評価

使用タイミング

タスク	使用場面
論文レビュー	査読、文献評価
研究設計	実験計画の妥当性確認
結果解釈	バイアスの影響評価
メタ分析	研究の質的評価

評価フレームワーク

1. 主張の構造分析

python

def analyze_claim(claim_text):
    """科学的主張の構造を分析"""
    return {
        "claim": "主張の核心",
        "evidence": "提示された証拠",
        "reasoning": "推論プロセス",
        "assumptions": "暗黙の前提",
        "limitations": "限界・条件"
    }

2. エビデンス階層（GRADE）

レベル	説明	信頼性
High	さらなる研究で結論が変わる可能性は低い	高
Moderate	さらなる研究で結論が変わる可能性がある	中
Low	さらなる研究で結論が変わる可能性が高い	低
Very Low	結論は非常に不確実	非常に低い

3. バイアスチェックリスト

python

BIAS_CHECKLIST = {
    "selection_bias": [
        "ランダム化は適切か？",
        "割り付け隠蔽はされているか？",
        "グループ間でベースラインは同等か？"
    ],
    "performance_bias": [
        "参加者は盲検化されているか？",
        "介入提供者は盲検化されているか？",
        "共介入は同等か？"
    ],
    "detection_bias": [
        "アウトカム評価者は盲検化されているか？",
        "評価方法は客観的か？"
    ],
    "attrition_bias": [
        "追跡率は十分か？（>80%）",
        "欠損データの処理は適切か？",
        "Intention-to-treat解析か？"
    ],
    "reporting_bias": [
        "事前登録されたアウトカムは全て報告されているか？",
        "選択的報告はないか？"
    ]
}

研究デザイン評価

RCT評価（CONSORT）

markdown

## CONSORTチェックリスト

### タイトル・要約
- [ ] タイトルでランダム化比較試験と明記
- [ ] 構造化要約（背景、方法、結果、結論）

### 導入
- [ ] 科学的背景と根拠の説明
- [ ] 具体的な目的または仮説

### 方法
- [ ] 参加者基準（適格・除外）
- [ ] 介入の詳細
- [ ] アウトカムの定義
- [ ] サンプルサイズ算出
- [ ] ランダム化手法
- [ ] 盲検化
- [ ] 統計解析方法

### 結果
- [ ] 参加者の流れ（フローチャート）
- [ ] 募集期間
- [ ] ベースラインデータ
- [ ] 解析対象
- [ ] アウトカムと推定値
- [ ] 副作用

### 議論
- [ ] 結果の解釈
- [ ] 限界
- [ ] 一般化可能性
- [ ] エビデンスとの整合性

観察研究評価（STROBE）

markdown

## STROBEチェックリスト

### タイトル・要約
- [ ] 研究デザインの明記（コホート、症例対照、横断）

### 導入
- [ ] 科学的背景
- [ ] 目的

### 方法
- [ ] 研究デザイン
- [ ] 設定
- [ ] 参加者
- [ ] 変数
- [ ] 測定方法
- [ ] バイアス対策
- [ ] サンプルサイズ
- [ ] 統計解析

### 結果
- [ ] 参加者
- [ ] 記述データ
- [ ] アウトカムデータ
- [ ] 主要結果
- [ ] その他の解析

### 議論
- [ ] 主要結果
- [ ] 限界
- [ ] 解釈
- [ ] 一般化可能性

統計的評価

p値の正しい解釈

python

def interpret_p_value(p, alpha=0.05):
    """p値の解釈ガイド"""
    
    interpretation = {
        "statistical_significance": p < alpha,
        "strength": None,
        "cautions": []
    }
    
    if p < 0.001:
        interpretation["strength"] = "非常に強い"
    elif p < 0.01:
        interpretation["strength"] = "強い"
    elif p < 0.05:
        interpretation["strength"] = "中程度"
    else:
        interpretation["strength"] = "弱い/有意でない"
    
    # 注意事項
    interpretation["cautions"] = [
        "p値は効果の大きさを示さない",
        "統計的有意性≠実質的有意性",
        "多重比較の問題を考慮",
        "検出力を確認"
    ]
    
    return interpretation

効果量の評価

効果量	Cohen's d	解釈
小	0.2	実質的に重要でない可能性
中	0.5	実質的に重要
大	0.8	強い実質的意義

ベストプラクティス

1. 主張を疑う

•「誰が言っているのか？」
•「何を根拠にしているのか？」
•「代替説明はあるか？」

2. 証拠を評価する

•出典は信頼できるか？
•サンプルサイズは十分か？
•再現性はあるか？

3. バイアスを探す

•利益相反
•確証バイアス
•出版バイアス

4. 結論を確認する

•データは主張を支持しているか？
•一般化可能か？
•限界は明記されているか？

トラブルシューティング

問題	対策
結論が過剰	データで支持される範囲に限定
バイアス見逃し	チェックリスト使用
因果関係の誤認	交絡因子の検討
再現性の欠如	方法の詳細確認

research-critical

Research Critical Thinking

概要

使用タイミング

評価フレームワーク

1. 主張の構造分析

2. エビデンス階層（GRADE）

3. バイアスチェックリスト

研究デザイン評価

RCT評価（CONSORT）

観察研究評価（STROBE）

統計的評価

p値の正しい解釈

効果量の評価

ベストプラクティス

1. 主張を疑う

2. 証拠を評価する

3. バイアスを探す

4. 結論を確認する

トラブルシューティング

関連スキル