AgentSkillsCN

generate-tts

通过Gemini TTS Pro生成深沉而富有感染力的旁白。在将韩语名言或哲学文本转换为音频时,可选用此功能。

SKILL.md
--- frontmatter
name: generate-tts
description: Gemini TTS Pro로 깊고 진지한 나레이션을 생성합니다. 한국어 명언이나 철학적 텍스트를 오디오로 변환할 때 사용하세요.
allowed-tools:
  - Bash
  - Read
  - Write

Generate TTS

Gemini 2.5 Pro TTS를 사용하여 깊고 낮은 톤의 나레이션 오디오를 생성합니다.

Instructions

  1. 한국어 텍스트 준비
  2. TTSGenerator 클래스 인스턴스 생성
  3. generate() 메서드로 TTS 오디오 생성
  4. WAV 파일로 저장

Usage

python
from src.quote_video.tts_generator import TTSGenerator

generator = TTSGenerator()
generator.generate(
    text="인생은 고통과 권태 사이를 왕복하는 진자운동이다.",
    output_path="output/narration_001.wav"
)

Config

항목
모델gemini-2.5-pro-preview-tts
보이스Enceladus (또는 Charon)
Deep, low-pitched, serious
출력 포맷WAV
샘플레이트24000 Hz
비트뎁스16-bit
채널Mono

Features

  1. 저음 나레이션: 수면/명상 콘텐츠에 적합한 깊은 톤
  2. 자연스러운 억양: Gemini TTS의 고품질 한국어 발음
  3. 일관된 음성: 모든 씬에서 동일한 보이스 유지
  4. 고품질 오디오: 24kHz 샘플링으로 명확한 음질