Whisper 文字起こしスキル
動画/音声ファイルからSRT形式の字幕を生成する。
重要事項
処理は数分〜数十分かかる。MCPツール呼び出し後、必ず完了まで待機すること。途中で処理を止めない。
ワークフロー
- •入力を確認(ファイルパス or URL)
- •適切なMCPツールを呼び出す
- •完了まで待機(途中で止めない)
- •結果を報告
MCPツール
transcribe_from_file
ローカルファイルから字幕生成。
code
file_path: ファイルの絶対パス(必須) device: "cuda" or "cpu"(デフォルト: cuda)
transcribe_from_url
URLから動画をダウンロードして字幕生成。
code
url: 動画URL(必須) device: "cuda" or "cpu"(デフォルト: cuda)
共通オプション
- •
input_lang: 入力言語(省略で自動検知) - •
output_lang: 翻訳先言語(省略で翻訳なし)
詳細パラメータは parameters.md を参照。
結果報告
成功時:
code
字幕ファイルを生成しました:
- 原文: {srt_path}
- 翻訳: {translated_srt_path}(翻訳時のみ)
- 検出言語: {detected_language}
- セグメント数: {segment_count}
失敗時:
code
エラーが発生しました: {error}