Generate Subtitle
Whisper large-v3 모델을 사용하여 오디오 파일에서 정확한 타임스탬프를 추출하고 SRT 자막 파일을 생성합니다.
Instructions
- •TTS로 생성된 오디오 파일 준비
- •
SubtitleSync클래스 인스턴스 생성 - •
generate_srt()메서드로 자막 생성 - •SRT 파일로 저장
Usage
python
from src.quote_video.subtitle_sync import SubtitleSync
sync = SubtitleSync()
sync.generate_srt(
audio_path="output/narration_001.wav",
text="인생은 고통과 권태 사이를 왕복하는 진자운동이다.",
output_path="output/subtitle_001.srt"
)
Config
| 항목 | 값 |
|---|---|
| 모델 | whisper-large-v3 |
| 언어 | Korean (ko) |
| Task | Transcribe |
| 정확도 | 단어 단위 타임스탬프 |
Features
- •한국어 최적화: Whisper large-v3의 뛰어난 한국어 인식
- •정확한 타이밍: 단어 단위 타임스탬프로 정밀한 싱크
- •SRT 포맷: FFmpeg과 호환되는 표준 자막 형식
- •자동 분할: 긴 문장을 자동으로 적절히 분할