Super Fact-Checker

识别声明 → 评估优先级 → 核查验证 → 标注结果

工作流程

code

内容 → 提取声明 → 分类（可核查/不可核查）
              → 排序（优先级）
              → 验证（找来源）
              → 标注（结果）

核心原则：

•只核查可核查的声明
•影响大 + 可疑度高的先查
•追溯到一手源
•标注要明确，不模糊

第一步：提取和分类声明

可核查的声明

•✅ 事实陈述："特斯拉 2024 年交付量为 180 万辆"
•✅ 数据引用："根据 Gartner 报告..."
•✅ 历史事件："苹果于 2007 年发布 iPhone"
•✅ 引用他人言论："马斯克说过..."

不可核查的声明

•❌ 观点/判断："这是最好的解决方案"
•❌ 预测："明年市场将增长 50%"
•❌ 主观感受："用户体验很好"
•❌ 模糊表述："很多人认为..."

处理：提取所有声明，标记哪些可核查、哪些不可核查。

第二步：确定核查优先级

优先级矩阵

	可疑度高	可疑度低
影响大	🔴 必须核查	🟡 应该核查
影响小	🟡 应该核查	🟢 可选核查

可疑度信号

•🚩 数字过于精确或过于整齐（"正好 100 万"）
•🚩 来源模糊（"研究表明"、"专家认为"）
•🚩 与常识或已知事实冲突
•🚩 过于绝对的表述（"唯一"、"首次"、"从未"）
•🚩 转述多次的信息

影响评估

•高影响：核心论点、关键数据、决策依据
•低影响：背景信息、举例说明、次要细节

第三步：核查验证

来源可信度层级

层级	来源类型	可信度	示例
1	官方一手源	⭐⭐⭐	财报、官方公告、法院文件
2	权威学术源	⭐⭐⭐	同行评审论文、官方统计
3	权威媒体	⭐⭐	NYT, WSJ, FT, 财新等
4	行业报告	⭐⭐	麦肯锡、Gartner（注意方法论）
5	普通媒体	⭐	一般新闻网站
6	自媒体/社交	⚠️	仅作线索，不可作为验证源

验证方法

数据类声明：

•找到原始数据源（财报、官方统计）
•核对具体数字和单位
•确认时间范围

引用类声明：

•找到原始出处（原文、原视频）
•核对是否断章取义
•确认说话人身份和语境

事件类声明：

•找到多个独立报道
•交叉验证关键细节
•注意时间线和因果关系

三角验证

关键声明需要 2-3 个独立来源交叉验证：

•独立 = 不互相引用、不同机构、不同时间
•若只有单一来源，标注"单源，待验证"

第四步：标注结果

标注体系

标注	含义	使用场景
✅ 已验证	找到可靠来源，信息准确	与一手源/权威源一致
⚠️ 部分验证	核心正确，细节有出入	数字略有偏差、表述不够精确
❓ 无法验证	找不到可靠来源	来源不明、信息过旧
❌ 有误	与可靠来源冲突	数据错误、事实错误
🔍 需进一步核查	重要但当前无法确认	需要专业知识或更多时间

输出格式

markdown

## 核查报告

### 摘要
- 总声明数：X 条
- 可核查：X 条
- 已核查：X 条
- 问题声明：X 条

### 核查结果

| # | 声明 | 结果 | 说明 |
|---|------|------|------|
| 1 | "特斯拉2024年交付180万辆" | ✅ | 与财报一致（来源：Tesla Q4 2024 财报） |
| 2 | "市场份额超过50%" | ⚠️ | 实际为47%（来源：XX报告） |
| 3 | "专家认为..." | ❓ | 未找到具体来源 |

### 建议修改
1. [声明 2]：建议改为"市场份额约47%"
2. [声明 3]：建议删除或补充具体来源

### 来源清单
- [来源1]: URL/引用
- [来源2]: URL/引用

Super Fact Checker

Super Fact-Checker

工作流程

第一步：提取和分类声明

可核查的声明

不可核查的声明

第二步：确定核查优先级

优先级矩阵

可疑度信号

影响评估

第三步：核查验证

来源可信度层级

验证方法

三角验证

第四步：标注结果

标注体系

输出格式

关键原则

不要做

要做