AgentSkillsCN

videocut-install

环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化。

SKILL.md
--- frontmatter
name: videocut-install
description: 环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化
metadata:
  version: "1.0.0"
  alias: "videocut:安装"
<!-- input: 无 output: 环境就绪 pos: 前置 skill,首次使用前运行 架构守护者:一旦我被修改,请同步更新: 1. ../README.md 的 Skill 清单 2. /CLAUDE.md 路由表 -->

安装

首次使用前的环境准备

快速使用

code
用户: 安装环境
用户: 初始化
用户: 下载模型

依赖清单

依赖用途安装命令
funasr口误识别pip install funasr
modelscope模型下载pip install modelscope
openai-whisper字幕生成pip install openai-whisper
ffmpeg视频剪辑brew install ffmpeg

模型清单

FunASR 模型(口误识别用)

首次运行自动下载到 ~/.cache/modelscope/

模型大小用途
paraformer-zh953MB语音识别(带时间戳)
punc_ct1.1GB标点预测
fsmn-vad4MB语音活动检测
小计~2GB

Whisper 模型(字幕生成用)

首次运行自动下载到 ~/.cache/whisper/

模型大小用途
large-v32.9GB字幕转录(质量最好)

总计

5GB 模型文件

安装流程

code
1. 安装 Python 依赖
       ↓
2. 安装 FFmpeg
       ↓
3. 下载 FunASR 模型(口误识别)
       ↓
4. 下载 Whisper 模型(字幕生成)
       ↓
5. 验证环境

执行步骤

1. 安装 Python 依赖

bash
pip install funasr modelscope openai-whisper

2. 安装 FFmpeg

bash
# macOS
brew install ffmpeg

# Ubuntu
sudo apt install ffmpeg

# 验证
ffmpeg -version

3. 下载 FunASR 模型(约2GB)

python
from funasr import AutoModel

model = AutoModel(
    model="paraformer-zh",
    vad_model="fsmn-vad",
    punc_model="ct-punc",
)
print("FunASR 模型下载完成")

4. 下载 Whisper 模型(约3GB)

python
import whisper

model = whisper.load_model("large-v3")
print("Whisper 模型下载完成")

5. 验证环境

python
from funasr import AutoModel

model = AutoModel(
    model="paraformer-zh",
    vad_model="fsmn-vad",
    punc_model="ct-punc",
    disable_update=True
)

# 测试转录(用任意音频/视频)
result = model.generate(input="test.mp4")
print("文本:", result[0]['text'][:50])
print("时间戳数量:", len(result[0]['timestamp']))
print("✅ 环境就绪")

常见问题

Q1: 模型下载慢

解决:使用国内镜像或手动下载

Q2: ffmpeg 命令找不到

解决:确认已安装并添加到 PATH

bash
which ffmpeg  # 应该输出路径

Q3: funasr 导入报错

解决:检查 Python 版本(需要 3.8+)

bash
python3 --version