AgentSkillsCN

research-critical

批判性思维与科学评估工具集。提供科学主张的评估、偏差检测以及基于证据层级的质量评价功能。

SKILL.md
--- frontmatter
name: research-critical
description: 批判的思考と科学的評価のツールキット。科学的主張の評価、バイアス検出、エビデンス階層に基づく品質評価を提供。
license: MIT
metadata:
  skill-version: "1.0.0"
  created: "2026-02-13"
  skill-author: "Mekann"
  integrated-from:
    - scientific-critical-thinking
  reference: "https://github.com/K-Dense-AI/claude-scientific-skills"

Research Critical Thinking

統合スキル: このスキルは scientific-critical-thinking をベースに拡張したものです。

概要

批判的思考と科学的評価のツールキット。科学的主張の妥当性評価、バイアス検出、研究品質評価を提供。

主な機能:

  • 科学的主張の評価フレームワーク
  • バイアス・交絡の検出
  • エビデンス階層(GRADE, Cochrane)の適用
  • 研究デザインの妥当性評価

使用タイミング

タスク使用場面
論文レビュー査読、文献評価
研究設計実験計画の妥当性確認
結果解釈バイアスの影響評価
メタ分析研究の質的評価

評価フレームワーク

1. 主張の構造分析

python
def analyze_claim(claim_text):
    """科学的主張の構造を分析"""
    return {
        "claim": "主張の核心",
        "evidence": "提示された証拠",
        "reasoning": "推論プロセス",
        "assumptions": "暗黙の前提",
        "limitations": "限界・条件"
    }

2. エビデンス階層(GRADE)

レベル説明信頼性
Highさらなる研究で結論が変わる可能性は低い
Moderateさらなる研究で結論が変わる可能性がある
Lowさらなる研究で結論が変わる可能性が高い
Very Low結論は非常に不確実非常に低い

3. バイアスチェックリスト

python
BIAS_CHECKLIST = {
    "selection_bias": [
        "ランダム化は適切か?",
        "割り付け隠蔽はされているか?",
        "グループ間でベースラインは同等か?"
    ],
    "performance_bias": [
        "参加者は盲検化されているか?",
        "介入提供者は盲検化されているか?",
        "共介入は同等か?"
    ],
    "detection_bias": [
        "アウトカム評価者は盲検化されているか?",
        "評価方法は客観的か?"
    ],
    "attrition_bias": [
        "追跡率は十分か?(>80%)",
        "欠損データの処理は適切か?",
        "Intention-to-treat解析か?"
    ],
    "reporting_bias": [
        "事前登録されたアウトカムは全て報告されているか?",
        "選択的報告はないか?"
    ]
}

研究デザイン評価

RCT評価(CONSORT)

markdown
## CONSORTチェックリスト

### タイトル・要約
- [ ] タイトルでランダム化比較試験と明記
- [ ] 構造化要約(背景、方法、結果、結論)

### 導入
- [ ] 科学的背景と根拠の説明
- [ ] 具体的な目的または仮説

### 方法
- [ ] 参加者基準(適格・除外)
- [ ] 介入の詳細
- [ ] アウトカムの定義
- [ ] サンプルサイズ算出
- [ ] ランダム化手法
- [ ] 盲検化
- [ ] 統計解析方法

### 結果
- [ ] 参加者の流れ(フローチャート)
- [ ] 募集期間
- [ ] ベースラインデータ
- [ ] 解析対象
- [ ] アウトカムと推定値
- [ ] 副作用

### 議論
- [ ] 結果の解釈
- [ ] 限界
- [ ] 一般化可能性
- [ ] エビデンスとの整合性

観察研究評価(STROBE)

markdown
## STROBEチェックリスト

### タイトル・要約
- [ ] 研究デザインの明記(コホート、症例対照、横断)

### 導入
- [ ] 科学的背景
- [ ] 目的

### 方法
- [ ] 研究デザイン
- [ ] 設定
- [ ] 参加者
- [ ] 変数
- [ ] 測定方法
- [ ] バイアス対策
- [ ] サンプルサイズ
- [ ] 統計解析

### 結果
- [ ] 参加者
- [ ] 記述データ
- [ ] アウトカムデータ
- [ ] 主要結果
- [ ] その他の解析

### 議論
- [ ] 主要結果
- [ ] 限界
- [ ] 解釈
- [ ] 一般化可能性

統計的評価

p値の正しい解釈

python
def interpret_p_value(p, alpha=0.05):
    """p値の解釈ガイド"""
    
    interpretation = {
        "statistical_significance": p < alpha,
        "strength": None,
        "cautions": []
    }
    
    if p < 0.001:
        interpretation["strength"] = "非常に強い"
    elif p < 0.01:
        interpretation["strength"] = "強い"
    elif p < 0.05:
        interpretation["strength"] = "中程度"
    else:
        interpretation["strength"] = "弱い/有意でない"
    
    # 注意事項
    interpretation["cautions"] = [
        "p値は効果の大きさを示さない",
        "統計的有意性≠実質的有意性",
        "多重比較の問題を考慮",
        "検出力を確認"
    ]
    
    return interpretation

効果量の評価

効果量Cohen's d解釈
0.2実質的に重要でない可能性
0.5実質的に重要
0.8強い実質的意義

ベストプラクティス

1. 主張を疑う

  • 「誰が言っているのか?」
  • 「何を根拠にしているのか?」
  • 「代替説明はあるか?」

2. 証拠を評価する

  • 出典は信頼できるか?
  • サンプルサイズは十分か?
  • 再現性はあるか?

3. バイアスを探す

  • 利益相反
  • 確証バイアス
  • 出版バイアス

4. 結論を確認する

  • データは主張を支持しているか?
  • 一般化可能か?
  • 限界は明記されているか?

トラブルシューティング

問題対策
結論が過剰データで支持される範囲に限定
バイアス見逃しチェックリスト使用
因果関係の誤認交絡因子の検討
再現性の欠如方法の詳細確認

関連スキル


このスキルは批判的思考と科学的評価のツールキットを提供します。