AgentSkillsCN

Super Fact Checker

Super Fact Checker

中文原作
SKILL.md

Super Fact-Checker

识别声明 → 评估优先级 → 核查验证 → 标注结果


工作流程

code
内容 → 提取声明 → 分类(可核查/不可核查)
              → 排序(优先级)
              → 验证(找来源)
              → 标注(结果)

核心原则

  • 只核查可核查的声明
  • 影响大 + 可疑度高的先查
  • 追溯到一手源
  • 标注要明确,不模糊

第一步:提取和分类声明

可核查的声明

  • ✅ 事实陈述:"特斯拉 2024 年交付量为 180 万辆"
  • ✅ 数据引用:"根据 Gartner 报告..."
  • ✅ 历史事件:"苹果于 2007 年发布 iPhone"
  • ✅ 引用他人言论:"马斯克说过..."

不可核查的声明

  • ❌ 观点/判断:"这是最好的解决方案"
  • ❌ 预测:"明年市场将增长 50%"
  • ❌ 主观感受:"用户体验很好"
  • ❌ 模糊表述:"很多人认为..."

处理:提取所有声明,标记哪些可核查、哪些不可核查。


第二步:确定核查优先级

优先级矩阵

可疑度高可疑度低
影响大🔴 必须核查🟡 应该核查
影响小🟡 应该核查🟢 可选核查

可疑度信号

  • 🚩 数字过于精确或过于整齐("正好 100 万")
  • 🚩 来源模糊("研究表明"、"专家认为")
  • 🚩 与常识或已知事实冲突
  • 🚩 过于绝对的表述("唯一"、"首次"、"从未")
  • 🚩 转述多次的信息

影响评估

  • 高影响:核心论点、关键数据、决策依据
  • 低影响:背景信息、举例说明、次要细节

第三步:核查验证

来源可信度层级

层级来源类型可信度示例
1官方一手源⭐⭐⭐财报、官方公告、法院文件
2权威学术源⭐⭐⭐同行评审论文、官方统计
3权威媒体⭐⭐NYT, WSJ, FT, 财新等
4行业报告⭐⭐麦肯锡、Gartner(注意方法论)
5普通媒体一般新闻网站
6自媒体/社交⚠️仅作线索,不可作为验证源

验证方法

数据类声明

  1. 找到原始数据源(财报、官方统计)
  2. 核对具体数字和单位
  3. 确认时间范围

引用类声明

  1. 找到原始出处(原文、原视频)
  2. 核对是否断章取义
  3. 确认说话人身份和语境

事件类声明

  1. 找到多个独立报道
  2. 交叉验证关键细节
  3. 注意时间线和因果关系

三角验证

关键声明需要 2-3 个独立来源交叉验证:

  • 独立 = 不互相引用、不同机构、不同时间
  • 若只有单一来源,标注"单源,待验证"

第四步:标注结果

标注体系

标注含义使用场景
✅ 已验证找到可靠来源,信息准确与一手源/权威源一致
⚠️ 部分验证核心正确,细节有出入数字略有偏差、表述不够精确
❓ 无法验证找不到可靠来源来源不明、信息过旧
❌ 有误与可靠来源冲突数据错误、事实错误
🔍 需进一步核查重要但当前无法确认需要专业知识或更多时间

输出格式

markdown
## 核查报告

### 摘要
- 总声明数:X 条
- 可核查:X 条
- 已核查:X 条
- 问题声明:X 条

### 核查结果

| # | 声明 | 结果 | 说明 |
|---|------|------|------|
| 1 | "特斯拉2024年交付180万辆" | ✅ | 与财报一致(来源:Tesla Q4 2024 财报) |
| 2 | "市场份额超过50%" | ⚠️ | 实际为47%(来源:XX报告) |
| 3 | "专家认为..." | ❓ | 未找到具体来源 |

### 建议修改
1. [声明 2]:建议改为"市场份额约47%"
2. [声明 3]:建议删除或补充具体来源

### 来源清单
- [来源1]: URL/引用
- [来源2]: URL/引用

关键原则

不要做

  • ❌ 把"无法验证"当作"有误"
  • ❌ 只找支持结论的来源(确认偏误)
  • ❌ 用二手源验证二手源
  • ❌ 忽略来源的利益相关性

要做

  • ✅ 追溯到一手源
  • ✅ 标注来源的可信度
  • ✅ 说明核查过程
  • ✅ 区分"事实错误"和"表述不精确"