CogView3/README_zh.md at main · THUDM/CogView3 · GitHub
快速开始
提示词优化
虽然 CogView3 系列模型都是通过长篇合成图像描述进行训练的,但我们强烈建议在文本生成图像之前,基于大语言模型(LLMs)进行提示词的重写操作,这将大大提高生成质量。
我们提供了一个 示例脚本。我们建议您运行这个脚本,以实现对提示词对润色
python prompt_optimize.py --api_key "智谱AI API Key" --prompt {你的提示词} --base_url "https://open.bigmodel.cn/api/paas/v4" --model "glm-4-plus"
推理模型(Diffusers)
首先,确保从源代码安装diffusers
库。
pip install git+https://github.com/huggingface/diffusers.git
接着,运行以下代码:
from diffusers import CogView3PlusPipeline
import torch
pipe = CogView3PlusPipeline.from_pretrained("THUDM/CogView3-Plus-3B