AgentSkillsCN

volcengine-image-gen

利用火山引擎(豆包)Seedream系列模型生成高质量图片。支持文本生图、多种分辨率、多种宽高比。

SKILL.md
--- frontmatter
name: volcengine-image-gen
description: 使用火山引擎(豆包)Seedream 系列模型生成高质量图片。支持文生图、多种分辨率、多种比例。

火山引擎图片生成

使用火山方舟 (Ark) 平台的 Seedream 系列模型生成高质量图片。

支持的模型

模型 ID名称特点
doubao-seedream-3-0-t2i-250115Seedream 3.0轻量级,速度快
doubao-seedream-4-0-t2i-250115Seedream 4.0标准质量
doubao-seedream-4-5-251128Seedream 4.5最新高质量 (默认)

快速开始

1. 配置 API Key

在 skill 目录的 .env 文件中配置:

bash
VOLCENGINE_IMAGE_API_KEY=你的-api-key
VOLCENGINE_IMAGE_ENDPOINT=https://ark.cn-beijing.volces.com/api/v3
VOLCENGINE_IMAGE_DEFAULT_MODEL=doubao-seedream-4-5-251128

或者在环境变量中设置:

bash
export VOLCENGINE_IMAGE_API_KEY=你的-api-key

2. 生成图片

bash
# 基础生成
python3 scripts/generate.py "一只可爱的猫咪" -o cat.png

# 指定比例
python3 scripts/generate.py "科幻城市夜景" -r 16:9 -o city.png

# 指定尺寸 (2K)
python3 scripts/generate.py "山水画" -W 2048 -H 2048 -o landscape.png

# 使用特定模型
python3 scripts/generate.py "赛博朋克风格" -m doubao-seedream-4-0-t2i-250115 -o cyber.png

# 生成多张
python3 scripts/generate.py "不同角度的跑车" -n 4 -o car.png

使用示例

示例 1: 基础文生图

bash
cd ~/clawd/skills/volcengine-image-gen
python3 scripts/generate.py "一只可爱的橘猫在窗台上晒太阳,水彩风格" -o cat.png

示例 2: 指定比例

bash
python3 scripts/generate.py "未来城市夜景,霓虹灯,赛博朋克" -r 16:9 -o cyberpunk.png

支持的比例:

  • 1:1 - 正方形
  • 16:9 / 9:16 - 宽屏/竖屏
  • 4:3 / 3:4 - 标准比例
  • 2:3 / 3:2 - 照片比例

示例 3: Python 调用

python
import sys
sys.path.insert(0, '/Users/xdrshjr/clawd/skills/volcengine-image-gen/scripts')
from generate import generate_image

# 生成图片
paths = generate_image(
    prompt="一只可爱的猫咪在花园里玩耍",
    ratio="1:1",
    output_path="cat.png"
)

print(f"图片已保存: {paths[0]}")

命令行参数

参数说明默认值
prompt图片描述提示词必填
-o, --output输出文件路径自动生成
-m, --model模型名称Seedream 4.5
-r, --ratio图片比例1:1
-W, --width图片宽度根据比例计算
-H, --height图片高度根据比例计算
-n, --number生成数量 (1-4)1
--no-watermark不添加水印-
--url返回 URL 而不是下载-
--list-models列出支持的模型-
--debug开启调试模式-

尺寸要求

  • 最小像素: 3,686,400 (约 1920x1920)
  • 推荐尺寸: 2048x2048 (2K)
  • 如果指定的比例尺寸不满足最小像素,会自动放大

环境变量

变量名说明必填
VOLCENGINE_IMAGE_API_KEY火山引擎 API Key
VOLCENGINE_IMAGE_ENDPOINTAPI 端点
VOLCENGINE_IMAGE_DEFAULT_MODEL默认模型

获取 API Key

  1. 访问 火山方舟控制台
  2. 点击右上角 API Key 管理
  3. 创建新的 API Key
  4. 复制 Key 并配置到 .env 文件

安装依赖

bash
cd ~/clawd/skills/volcengine-image-gen
pip3 install -r requirements.txt

故障排除

API Key 无效

code
AuthenticationError: The API key format is incorrect

解决: 确认使用的是火山方舟 (Ark) 的 API Key,不是语音合成的 Access Token。

尺寸太小

code
InvalidParameter: image size must be at least 3686400 pixels

解决: 使用更大的尺寸,如 2048x2048 或更大的比例。

网络超时

code
网络请求失败

解决: 图片生成可能需要 30-60 秒,请检查网络连接。

提示词技巧

有效的提示词结构

code
[主体], [细节描述], [风格], [光线], [构图], [色彩]

示例

code
一只可爱的橘猫,趴在窗台上晒太阳,毛发柔软蓬松,
水彩画风格,柔和的自然光线,温馨的氛围,
暖色调,细节丰富,高清画质

常用风格关键词

  • 写实: photorealistic, realistic, detailed
  • 动漫: anime, manga, cartoon style
  • 油画: oil painting, classical art
  • 水彩: watercolor, soft colors
  • 赛博朋克: cyberpunk, neon lights, futuristic
  • 中国风: Chinese traditional style, ink wash painting

参考文档