AgentSkillsCN

research-data

面向科研与数据分析的匿名化处理

SKILL.md
--- frontmatter
name: research-data
description: 研究・データ分析向けの匿名化
keywords:
  - 研究
  - 分析
  - データ
  - 統計
  - 解析
  - research
  - analysis
  - データセット
  - dataset
  - 機械学習
  - AI

研究データ用匿名化ガイド

このスキルは研究・データ分析用途に特化した匿名化を提供します。

識別子の取り扱い

カテゴリ処理方法
氏名ハッシュ化ID→ a1b2c3d4
年齢数値を保持47歳 → 47
日付相対日数→ Day 0, Day 30
住所地域コード化→ Region_13

データ分析価値の維持

  • 数値データは可能な限り保持
  • カテゴリ変数のラベルは一般化
  • 時系列の相対関係は保持

k-匿名性への配慮

  • 準識別子の組み合わせに注意
  • 希少な値は一般化またはグループ化
  • 外れ値はトップ/ボトムコーディング