YouTube Transcribe Skill
Полный пайплайн: скачивает аудио из YouTube и транскрибирует через Groq Whisper API.
Capabilities
- •Извлечение аудио из YouTube видео (yt-dlp + deno)
- •Конвертация в mp3 (лучшее качество)
- •Транскрипция через Groq Whisper API (whisper-large-v3)
- •Автоматическое определение языка
- •Автоматическое удаление временных файлов
- •Поддержка любых публичных YouTube URL
Dependencies
- •
yt-dlp(установлен: /usr/local/bin/yt-dlp) - •
deno(установлен: ~/.deno/bin/deno) - •
requests(Python library для HTTP) - •
GROQ_API_KEY(env variable) - •Python 3 scripts:
- •
~/clawd/scripts/download_youtube_audio.py - •
~/clawd/scripts/transcribe_audio.py - •
~/clawd/scripts/transcribe_youtube.py(комбинированный)
- •
Usage
1. Полная транскрипция (download + transcribe):
bash
python3 ~/clawd/scripts/transcribe_youtube.py <youtube_url>
Пример:
bash
python3 ~/clawd/scripts/transcribe_youtube.py \ "https://www.youtube.com/watch?v=dQw4w9WgXcQ"
Результат:
code
YouTube Transcriber ================================================== [1/2] Downloading audio from YouTube... ✓ Audio saved: /path/to/youtube_transcripts/dQw4w9WgXcQ.mp3 [2/2] Transcribing audio... ✓ Audio file deleted ================================================== ✓ SUCCESS URL: https://www.youtube.com/watch?v=dQw4w9WgXcQ Language: English Duration: 212.9s Transcript: -------------------------------------------------- We're no strangers to love...
Опции:
- •
--keep-audio— сохранить аудио файл после транскрипции
2. Только скачивание аудио:
bash
python3 ~/clawd/scripts/download_youtube_audio.py <youtube_url> [output_dir]
3. Только транскрипция (готового аудио):
bash
python3 ~/clawd/scripts/transcribe_audio.py <audio_file>
4. Через clawd (агента):
Просто попроси:
- •"Транскрибируй это YouTube видео: [URL]"
- •"Что говорится в этом видео: https://youtube.com/..."
- •"Скачай и транскрибируй: [URL]"
Агент автоматически:
- •Скачает аудио через
download_youtube_audio.py - •Отправит на Groq Whisper API через
transcribe_audio.py - •Вернёт транскрипцию с языком и длительностью
- •Удалит временный аудио файл
Limitations
- •Работает только с публичными YouTube видео
- •Требует стабильное соединение с YouTube
- •Таймаут: 5 минут на скачивание
Troubleshooting
Ошибка: "No supported JavaScript runtime" → Убедись что deno установлен и в PATH
Ошибка: "Sign in to confirm you're not a bot" → С deno runtime эта ошибка НЕ должна возникать (deno решает JS challenges)
Technical Notes
- •Tier 1 solution (нативный yt-dlp, без сторонних API)
- •Deno runtime решает YouTube JS challenges автоматически
- •Cookies НЕ нужны (в отличие от старых версий)
- •Формат: mp3, качество: 0 (лучшее)
Next Steps
После транскрипции можно:
- •Сохранить transcript в файл (.txt или .md)
- •Анализировать контент (sentiment, keywords, summary)
- •Извлекать структурированные данные (timestamps, speakers)
- •Генерировать краткое саммари через LLM
- •Переводить на другие языки
Example Workflow
bash
# Полный пайплайн cd ~/clawd python3 scripts/transcribe_youtube.py "https://youtube.com/watch?v=VIDEO_ID" > transcript.txt # С сохранением аудио python3 scripts/transcribe_youtube.py "https://youtube.com/watch?v=VIDEO_ID" --keep-audio