Python + DALL·E / Gemini 批量生图实战：从单张到流水线的完整方案

匿名上传

发布时间:2026-02-24 17:24:01

为什么选 API 而不是 Web 端

手动用 ChatGPT 或 Gemini 网页版生图，一张张来效率太低。API 的优势：

可编程：批量 prompt、自动重试、结果归档
可控：指定尺寸、模型版本、输出格式
可集成：嵌入现有工作流，比如电商上架、内容生产

基础代码：OpenAI SDK 调用生图

import openai
import base64
from pathlib import Path

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.openai.com/v1"  # 或替换为中转地址
)

def generate_image(prompt, model="dall-e-3", size="1024x1024"):
    """生成单张图片，返回 base64 数据"""
    resp = client.images.generate(
        model=model,
        prompt=prompt,
        size=size,
        response_format="b64_json"
    )
    return resp.data[0].b64_json

# 示例
img_data = generate_image("一杯冰美式咖啡，白色背景，商业摄影风格")
Path("output.png").write_bytes(base64.b64decode(img_data))

这是最基础的用法，下面加上批量和容错。

进阶：批量生成 + 自动重试

import time
import json

def batch_generate(prompts, output_dir="./images", model="dall-e-3", max_retries=3):
    """批量生图，带重试和进度记录"""
    Path(output_dir).mkdir(exist_ok=True)
    results = []

    for i, prompt in enumerate(prompts):
        for attempt in range(max_retries):
            try:
                print(f"[{i+1}/{len(prompts)}] 生成中... (尝试 {attempt+1})")
                img_data = generate_image(prompt, model=model)
                
                filename = f"{output_dir}/img_{i+1:03d}.png"
                Path(filename).write_bytes(base64.b64decode(img_data))
                
                results.append({"prompt": prompt, "file": filename, "status": "ok"})
                print(f"   保存到 {filename}")
                break
            except Exception as e:
                print(f"   失败: {e}")
                if attempt < max_retries - 1:
                    time.sleep(2 ** attempt)  # 指数退避
                else:
                    results.append({"prompt": prompt, "file": None, "status": str(e)})

        time.sleep(1)  # rate limit 友好

    # 保存生成记录
    Path(f"{output_dir}/manifest.json").write_text(
        json.dumps(results, ensure_ascii=False, indent=2)
    )
    return results

用法：

prompts = [
    "简约风格的蓝牙耳机，产品展示图，白色背景",
    "ins风格的手工蛋糕，暖色调，俯拍角度",
    "极简主义办公桌面，科技感，4K渲染风格",
]

batch_generate(prompts, model="dall-e-3")

模型选择建议

实测下来几个生图模型的特点：

模型	擅长场景	短板	速度
DALL·E 3	文字渲染、海报	写实人像偶尔崩	中等
Gemini 3 Pro	写实风格、多元素场景	艺术风格化稍弱	快
GPT-5 (图片)	综合能力强	贵	中等