Super Fact-Checker
识别声明 → 评估优先级 → 核查验证 → 标注结果
工作流程
code
内容 → 提取声明 → 分类(可核查/不可核查)
→ 排序(优先级)
→ 验证(找来源)
→ 标注(结果)
核心原则:
- •只核查可核查的声明
- •影响大 + 可疑度高的先查
- •追溯到一手源
- •标注要明确,不模糊
第一步:提取和分类声明
可核查的声明
- •✅ 事实陈述:"特斯拉 2024 年交付量为 180 万辆"
- •✅ 数据引用:"根据 Gartner 报告..."
- •✅ 历史事件:"苹果于 2007 年发布 iPhone"
- •✅ 引用他人言论:"马斯克说过..."
不可核查的声明
- •❌ 观点/判断:"这是最好的解决方案"
- •❌ 预测:"明年市场将增长 50%"
- •❌ 主观感受:"用户体验很好"
- •❌ 模糊表述:"很多人认为..."
处理:提取所有声明,标记哪些可核查、哪些不可核查。
第二步:确定核查优先级
优先级矩阵
| 可疑度高 | 可疑度低 | |
|---|---|---|
| 影响大 | 🔴 必须核查 | 🟡 应该核查 |
| 影响小 | 🟡 应该核查 | 🟢 可选核查 |
可疑度信号
- •🚩 数字过于精确或过于整齐("正好 100 万")
- •🚩 来源模糊("研究表明"、"专家认为")
- •🚩 与常识或已知事实冲突
- •🚩 过于绝对的表述("唯一"、"首次"、"从未")
- •🚩 转述多次的信息
影响评估
- •高影响:核心论点、关键数据、决策依据
- •低影响:背景信息、举例说明、次要细节
第三步:核查验证
来源可信度层级
| 层级 | 来源类型 | 可信度 | 示例 |
|---|---|---|---|
| 1 | 官方一手源 | ⭐⭐⭐ | 财报、官方公告、法院文件 |
| 2 | 权威学术源 | ⭐⭐⭐ | 同行评审论文、官方统计 |
| 3 | 权威媒体 | ⭐⭐ | NYT, WSJ, FT, 财新等 |
| 4 | 行业报告 | ⭐⭐ | 麦肯锡、Gartner(注意方法论) |
| 5 | 普通媒体 | ⭐ | 一般新闻网站 |
| 6 | 自媒体/社交 | ⚠️ | 仅作线索,不可作为验证源 |
验证方法
数据类声明:
- •找到原始数据源(财报、官方统计)
- •核对具体数字和单位
- •确认时间范围
引用类声明:
- •找到原始出处(原文、原视频)
- •核对是否断章取义
- •确认说话人身份和语境
事件类声明:
- •找到多个独立报道
- •交叉验证关键细节
- •注意时间线和因果关系
三角验证
关键声明需要 2-3 个独立来源交叉验证:
- •独立 = 不互相引用、不同机构、不同时间
- •若只有单一来源,标注"单源,待验证"
第四步:标注结果
标注体系
| 标注 | 含义 | 使用场景 |
|---|---|---|
| ✅ 已验证 | 找到可靠来源,信息准确 | 与一手源/权威源一致 |
| ⚠️ 部分验证 | 核心正确,细节有出入 | 数字略有偏差、表述不够精确 |
| ❓ 无法验证 | 找不到可靠来源 | 来源不明、信息过旧 |
| ❌ 有误 | 与可靠来源冲突 | 数据错误、事实错误 |
| 🔍 需进一步核查 | 重要但当前无法确认 | 需要专业知识或更多时间 |
输出格式
markdown
## 核查报告 ### 摘要 - 总声明数:X 条 - 可核查:X 条 - 已核查:X 条 - 问题声明:X 条 ### 核查结果 | # | 声明 | 结果 | 说明 | |---|------|------|------| | 1 | "特斯拉2024年交付180万辆" | ✅ | 与财报一致(来源:Tesla Q4 2024 财报) | | 2 | "市场份额超过50%" | ⚠️ | 实际为47%(来源:XX报告) | | 3 | "专家认为..." | ❓ | 未找到具体来源 | ### 建议修改 1. [声明 2]:建议改为"市场份额约47%" 2. [声明 3]:建议删除或补充具体来源 ### 来源清单 - [来源1]: URL/引用 - [来源2]: URL/引用
关键原则
不要做
- •❌ 把"无法验证"当作"有误"
- •❌ 只找支持结论的来源(确认偏误)
- •❌ 用二手源验证二手源
- •❌ 忽略来源的利益相关性
要做
- •✅ 追溯到一手源
- •✅ 标注来源的可信度
- •✅ 说明核查过程
- •✅ 区分"事实错误"和"表述不精确"