AgentSkillsCN

youtube-transcript-cn

从 YouTube 视频链接提取字幕并转换为中文文字稿。支持自动生成字幕和手动字幕。 使用场景:(1) 用户提供 YouTube 链接并要求提取字幕/文字稿,(2) 用户要求将 YouTube 视频内容转为文字, (3) 用户说"帮我把这个 YouTube 视频转成文字"或类似请求。 触发词:YouTube 字幕、视频转文字、提取字幕、YouTube transcript、视频文字稿。

中文原作
SKILL.md
--- frontmatter
name: youtube-transcript-cn
description: |
  从 YouTube 视频链接提取字幕并转换为中文文字稿。支持自动生成字幕和手动字幕。
  使用场景:(1) 用户提供 YouTube 链接并要求提取字幕/文字稿,(2) 用户要求将 YouTube 视频内容转为文字,
  (3) 用户说"帮我把这个 YouTube 视频转成文字"或类似请求。
  触发词:YouTube 字幕、视频转文字、提取字幕、YouTube transcript、视频文字稿。

YouTube 字幕提取技能

从 YouTube 视频提取字幕,输出中文文字稿。

快速使用

bash
python3 scripts/get_transcript.py "https://www.youtube.com/watch?v=VIDEO_ID"

工作流程

  1. 获取视频链接:从用户消息中提取 YouTube URL
  2. 运行脚本:执行 scripts/get_transcript.py 提取字幕
  3. 处理输出
    • 如果字幕是中文:直接输出
    • 如果字幕是英文:翻译为中文后输出
  4. 保存结果:根据用户需求保存为 Markdown 文件

脚本参数

参数说明默认值
urlYouTube 视频链接或 ID必填
-f, --format输出格式: text, markdown, jsonmarkdown
-t, --timestamps包含时间戳
-l, --lang首选语言(逗号分隔)zh,en
-o, --output输出文件路径stdout

使用示例

基本用法

bash
python3 scripts/get_transcript.py "https://www.youtube.com/watch?v=dQw4w9WgXcQ"

带时间戳输出

bash
python3 scripts/get_transcript.py -t "https://youtu.be/VIDEO_ID"

保存到文件

bash
python3 scripts/get_transcript.py -o output.md "https://www.youtube.com/watch?v=VIDEO_ID"

JSON 格式(便于后处理)

bash
python3 scripts/get_transcript.py -f json "VIDEO_ID"

支持的 URL 格式

  • https://www.youtube.com/watch?v=VIDEO_ID
  • https://youtu.be/VIDEO_ID
  • https://www.youtube.com/embed/VIDEO_ID
  • 直接使用 Video ID

语言优先级

脚本按以下顺序查找字幕:

  1. 简体中文 (zh-Hans)
  2. 繁体中文 (zh-Hant)
  3. 中文 (zh)
  4. 英文 (en)
  5. 自动生成字幕

翻译处理

如果获取到的是英文字幕,需要翻译为中文:

  1. 运行脚本获取英文字幕
  2. 使用 Claude 内置能力翻译为流畅的中文
  3. 保持原文结构和段落划分

错误处理

错误原因解决方案
No captions available视频无字幕告知用户该视频没有可用字幕
Cannot extract video IDURL 格式错误请求用户提供正确的 YouTube 链接
网络超时网络问题重试或检查网络连接

输出格式示例

Markdown 格式

markdown
# 视频标题

- **Video ID**: abc123
- **语言**: 中文(自动生成)
- **链接**: https://www.youtube.com/watch?v=abc123

---

## 文字稿

这是视频的第一段内容...

这是视频的第二段内容...