AgentSkillsCN

Paper Explainer

白话论文解读——将学术论文翻译成通俗易懂的中文解读文档,并配以图解、示例代码及知识点补充。

SKILL.md
--- frontmatter
description: 大白话论文解读 - 将学术论文翻译成通俗易懂的中文解读文档,配有图解、示例代码和知识点补充
globs: ["*.pdf"]
mcp:
  playwright:
    command: npx
    args: ["-y", "@playwright/mcp@latest"]

大白话论文解读 Skill

将学术论文(PDF)翻译成人人都能懂的中文解读文档。

触发条件

  • 用户提供 PDF 论文文件
  • 用户使用关键词:解读论文大白话通俗解读论文翻译

输出规范

文件结构

code
{论文名}-explained/
├── {论文名}.pdf              # 原始论文
├── {论文名}-通俗解读.md       # 中文解读文档
└── images/                    # 配图目录
    ├── 01-xxx.svg
    ├── 02-xxx.svg
    └── ...

文档结构要求

  1. 标题区

    • 论文标题(中英文)
    • 发表信息(期刊/会议、年份)
    • 作者信息
    • 一句话总结
  2. 目录

    • 使用 Markdown 锚点链接
  3. 核心内容(按论文结构调整)

    • 这篇论文在讲什么?(用比喻解释)
    • 为什么这篇论文很重要?
    • 核心方法详解
    • 实验结果
    • 局限性与未来工作
    • 总结与思考
  4. 必须包含的元素

    知识点补充框:用 blockquote 解释专业术语

    markdown
    > **知识点补充 - 术语名**  
    > 通俗解释...
    

    对比表格:用表格展示对比信息

    markdown
    | 方面 | 方法A | 方法B |
    |------|-------|-------|
    | ... | ... | ... |
    

    流程图/架构图:用 SVG 格式

    • 使用渐变色美化
    • 中文标注
    • 清晰的箭头和连接

    示例代码

    • Python 为主
    • 包含详细注释
    • 可运行的伪代码或真实代码

    数学公式解读

    • 先给出原公式(LaTeX)
    • 再用大白话翻译每个符号的含义
  5. 参考资料

    • 论文原文链接
    • GitHub 仓库(如有)
    • 相关资源

执行步骤

Step 1: 获取论文内容

  1. 如果是 PDF 文件,尝试用 look_at 工具提取内容
  2. 如果 PDF 无法读取,尝试:
    • 通过 arXiv ID 获取 HTML 版本:https://ar5iv.labs.arxiv.org/html/{arxiv_id}
    • 通过 arXiv 获取摘要页:https://arxiv.org/abs/{arxiv_id}
    • 使用 Playwright 浏览器访问
  3. 搜索相关的中文解读文章作为补充(知乎、公众号等)

Step 2: 创建文件结构

bash
mkdir -p {output_dir}/images

Step 3: 创建 SVG 配图

为以下内容创建可视化图片:

  • 整体架构/流程图
  • 核心算法示意图
  • 对比图表
  • 关键概念图解

SVG 设计规范

  • 使用 linearGradient 创建渐变色
  • 圆角矩形 rx="10"
  • 清晰的字体 font-family="Arial, sans-serif"
  • 中文标注
  • 配色参考:蓝紫色系 #667eea #764ba2、绿色系 #48bb78 #38a169

Step 4: 撰写解读文档

写作风格

  • 用比喻和类比解释复杂概念
  • 先说结论,再解释原因
  • 多用"大白话翻译"
  • 加入个人见解和思考
  • 使用 emoji 增加可读性(适度)

专业术语处理

  • 首次出现时给出英文原文
  • 用知识点补充框解释
  • 用日常例子类比

Step 5: 添加补充内容

  1. 搜索相关的解读文章
  2. 提取有价值的补充信息
  3. 整合到文档中
  4. 标注信息来源

Step 6: 整理文件

将原始 PDF 移动到输出目录,确保结构完整。

质量检查清单

  • 非专业人士能看懂吗?
  • 核心概念都有图解吗?
  • 专业术语都有解释吗?
  • 有可运行的示例代码吗?
  • 数学公式都有大白话翻译吗?
  • 文档结构清晰、目录可跳转吗?
  • 图片都是 SVG 格式并且美观吗?
  • 有个人见解和思考吗?

示例输出

参考本仓库中的示例:Learning/deepseek-r1-explained/

该示例包含:

  • DeepSeek-R1 论文的完整解读
  • 6 张 SVG 配图
  • 3 段示例代码
  • 多处知识点补充
  • 训练成本、失败尝试等独家内容