Research Critical Thinking
統合スキル: このスキルは scientific-critical-thinking をベースに拡張したものです。
概要
批判的思考と科学的評価のツールキット。科学的主張の妥当性評価、バイアス検出、研究品質評価を提供。
主な機能:
- •科学的主張の評価フレームワーク
- •バイアス・交絡の検出
- •エビデンス階層(GRADE, Cochrane)の適用
- •研究デザインの妥当性評価
使用タイミング
| タスク | 使用場面 |
|---|---|
| 論文レビュー | 査読、文献評価 |
| 研究設計 | 実験計画の妥当性確認 |
| 結果解釈 | バイアスの影響評価 |
| メタ分析 | 研究の質的評価 |
評価フレームワーク
1. 主張の構造分析
python
def analyze_claim(claim_text):
"""科学的主張の構造を分析"""
return {
"claim": "主張の核心",
"evidence": "提示された証拠",
"reasoning": "推論プロセス",
"assumptions": "暗黙の前提",
"limitations": "限界・条件"
}
2. エビデンス階層(GRADE)
| レベル | 説明 | 信頼性 |
|---|---|---|
| High | さらなる研究で結論が変わる可能性は低い | 高 |
| Moderate | さらなる研究で結論が変わる可能性がある | 中 |
| Low | さらなる研究で結論が変わる可能性が高い | 低 |
| Very Low | 結論は非常に不確実 | 非常に低い |
3. バイアスチェックリスト
python
BIAS_CHECKLIST = {
"selection_bias": [
"ランダム化は適切か?",
"割り付け隠蔽はされているか?",
"グループ間でベースラインは同等か?"
],
"performance_bias": [
"参加者は盲検化されているか?",
"介入提供者は盲検化されているか?",
"共介入は同等か?"
],
"detection_bias": [
"アウトカム評価者は盲検化されているか?",
"評価方法は客観的か?"
],
"attrition_bias": [
"追跡率は十分か?(>80%)",
"欠損データの処理は適切か?",
"Intention-to-treat解析か?"
],
"reporting_bias": [
"事前登録されたアウトカムは全て報告されているか?",
"選択的報告はないか?"
]
}
研究デザイン評価
RCT評価(CONSORT)
markdown
## CONSORTチェックリスト ### タイトル・要約 - [ ] タイトルでランダム化比較試験と明記 - [ ] 構造化要約(背景、方法、結果、結論) ### 導入 - [ ] 科学的背景と根拠の説明 - [ ] 具体的な目的または仮説 ### 方法 - [ ] 参加者基準(適格・除外) - [ ] 介入の詳細 - [ ] アウトカムの定義 - [ ] サンプルサイズ算出 - [ ] ランダム化手法 - [ ] 盲検化 - [ ] 統計解析方法 ### 結果 - [ ] 参加者の流れ(フローチャート) - [ ] 募集期間 - [ ] ベースラインデータ - [ ] 解析対象 - [ ] アウトカムと推定値 - [ ] 副作用 ### 議論 - [ ] 結果の解釈 - [ ] 限界 - [ ] 一般化可能性 - [ ] エビデンスとの整合性
観察研究評価(STROBE)
markdown
## STROBEチェックリスト ### タイトル・要約 - [ ] 研究デザインの明記(コホート、症例対照、横断) ### 導入 - [ ] 科学的背景 - [ ] 目的 ### 方法 - [ ] 研究デザイン - [ ] 設定 - [ ] 参加者 - [ ] 変数 - [ ] 測定方法 - [ ] バイアス対策 - [ ] サンプルサイズ - [ ] 統計解析 ### 結果 - [ ] 参加者 - [ ] 記述データ - [ ] アウトカムデータ - [ ] 主要結果 - [ ] その他の解析 ### 議論 - [ ] 主要結果 - [ ] 限界 - [ ] 解釈 - [ ] 一般化可能性
統計的評価
p値の正しい解釈
python
def interpret_p_value(p, alpha=0.05):
"""p値の解釈ガイド"""
interpretation = {
"statistical_significance": p < alpha,
"strength": None,
"cautions": []
}
if p < 0.001:
interpretation["strength"] = "非常に強い"
elif p < 0.01:
interpretation["strength"] = "強い"
elif p < 0.05:
interpretation["strength"] = "中程度"
else:
interpretation["strength"] = "弱い/有意でない"
# 注意事項
interpretation["cautions"] = [
"p値は効果の大きさを示さない",
"統計的有意性≠実質的有意性",
"多重比較の問題を考慮",
"検出力を確認"
]
return interpretation
効果量の評価
| 効果量 | Cohen's d | 解釈 |
|---|---|---|
| 小 | 0.2 | 実質的に重要でない可能性 |
| 中 | 0.5 | 実質的に重要 |
| 大 | 0.8 | 強い実質的意義 |
ベストプラクティス
1. 主張を疑う
- •「誰が言っているのか?」
- •「何を根拠にしているのか?」
- •「代替説明はあるか?」
2. 証拠を評価する
- •出典は信頼できるか?
- •サンプルサイズは十分か?
- •再現性はあるか?
3. バイアスを探す
- •利益相反
- •確証バイアス
- •出版バイアス
4. 結論を確認する
- •データは主張を支持しているか?
- •一般化可能か?
- •限界は明記されているか?
トラブルシューティング
| 問題 | 対策 |
|---|---|
| 結論が過剰 | データで支持される範囲に限定 |
| バイアス見逃し | チェックリスト使用 |
| 因果関係の誤認 | 交絡因子の検討 |
| 再現性の欠如 | 方法の詳細確認 |
関連スキル
- •research-writing: 学術執筆
- •research-statistics: 統計分析
- •research-literature: 文献調査
このスキルは批判的思考と科学的評価のツールキットを提供します。