AgentSkillsCN

speech-generator

利用 ElevenLabs TTS 将文本转换为语音音频。当用户提出“发送语音”“发送音频消息”“创建语音”“生成语音”“说点什么”“语音留言”“给我发段音频”,或需要 TTS 语音合成与旁白配音时,可使用此技能。

SKILL.md
--- frontmatter
name: speech-generator
description: "Generate speech audio from text using ElevenLabs TTS. Use when user asks to 'send voice', 'send audio message', 'create voice', 'generate speech', 'say something', 'voice message', 'send me audio', or needs TTS/narration."
version: "1.0.0"
author: aviz85
tags:
  - tts
  - speech
  - audio
  - elevenlabs
  - voice
setup: "./SETUP.md"
setup_complete: false

Speech Generator

First time? If setup_complete: false above, run ./SETUP.md first, then set setup_complete: true.

Generate speech audio using ElevenLabs TTS.

Voice ID

Configure your voice ID from ElevenLabs:

code
YOUR_VOICE_ID

Get voice IDs from ElevenLabs - you can use built-in voices or clone your own.

Prompt Guidelines (Hebrew)

Write prompts as natural spoken Hebrew. Use square brackets [...] for speech directions.

Direction Examples

code
[נשימה עמוקה] אוקיי, אז בואו נדבר על זה...
[צחוק קל] זה ממש מצחיק שאתה אומר את זה
[בהתלהבות] וואו! זה בדיוק מה שחיכיתי לו!
[ברצינות] עכשיו, תקשיבו טוב...
[בעצב] אני לא יודע מה להגיד...
[בשקט] זה סוד, אבל...
[מהר] צריך לרוץ עכשיו, אין זמן!
[לאט ובבירור] חשוב. מאוד. להקשיב.
[שאלה] אתה בטוח שזה מה שאתה רוצה?
[הפתעה] רגע, מה?!

Natural Speech Patterns

Add filler words and pauses for natural flow:

  • אממ...
  • אהה...
  • כאילו...
  • נו...
  • יאללה...
  • בקיצור...
  • ... (pause)

Example Prompt

code
[בהתלהבות] היי! מה קורה?
אממ... אז רציתי לספר לכם משהו מטורף שקרה לי היום.
[נשימה] אז הלכתי לקפה, וואלה, פתאום רואה את... [בשקט] אתה לא תאמין למי.
[צחוק] כן, בדיוק מי שחשבת!

Commands

bash
cd ~/.claude/skills/speech-generator/scripts

# Generate speech
npx ts-node generate_speech.ts \
  -t "[בהתלהבות] היי! מה קורה?" \
  -o /path/to/output.mp3

# From file
npx ts-node generate_speech.ts \
  -f /path/to/script.txt \
  -o /path/to/output.mp3

# List voices
npx ts-node generate_speech.ts --list-voices

Options

OptionShortDefault
--text-tText to speak
--file-fRead from file
--output-oOutput path (required)
--voice-vVoice ID
--speed1.0
--stability0.5
--similarity0.75