文生图模型

asd8705

已于 2024-10-19 14:47:29 修改

阅读量423

点赞数 7

CC 4.0 BY-SA版权

文章标签：文生图

于 2024-10-19 11:07:12 首次发布

本文链接：https://blog.csdn.net/asd8705/article/details/143069759

CogView3/README_zh.md at main · THUDM/CogView3 · GitHub

快速开始

提示词优化

虽然 CogView3 系列模型都是通过长篇合成图像描述进行训练的，但我们强烈建议在文本生成图像之前，基于大语言模型（LLMs）进行提示词的重写操作，这将大大提高生成质量。

我们提供了一个示例脚本。我们建议您运行这个脚本，以实现对提示词对润色

python prompt_optimize.py --api_key "智谱AI API Key" --prompt {你的提示词} --base_url "https://open.bigmodel.cn/api/paas/v4" --model "glm-4-plus"

推理模型(Diffusers)

首先，确保从源代码安装diffusers库。

pip install git+https://github.com/huggingface/diffusers.git

接着，运行以下代码：

from diffusers import CogView3PlusPipeline
import torch

pipe = CogView3PlusPipeline.from_pretrained("THUDM/CogView3-Plus-3B

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

asd8705

关注关注

7
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

（3-3）文生图模型架构：生成对抗网络（GAN）

码农三叔

08-13

1216

WGAN（Wasserstein GAN）通过引入Wasserstein距离（也称为Earth Mover's Distance）来改善传统GAN的训练稳定性，WGAN不使用传统的二元交叉熵损失，而是通过最小化生成样本与真实样本之间的Wasserstein距离来指导模型的优化。GAN通过生成器和判别器的对抗训练，使生成器能够生成以假乱真的图像，而判别器则负责区分生成的图像与真实图像。GAN在图像生成领域有广泛的应用，凭借其强大的生成能力，可以在多个任务中生成高质量、逼真的图像。

本地部署文生图模型 Flux

engchina的专栏

08-03

6283

本地部署文生图模型 Flux

参与评论您还未登录，请先登录后发表或查看评论

AIGC：python 文生图代码（python + stable-diffusion+ cuda)

weixin_43911199的博客

09-16

1121

搭建文生图，AIGC基础，文中有标注遇到的坑

Python酷玩之旅_aigc文生图模型入门（通义万相）

splendid_java的专栏

11-07

4131

博主最近一直使用阿里的文生图模型（通义万相），生成一些图片。这个模型的用途，可通过阿里云官网的模型服务（MaaS），略窥一二：通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型，能够根据用户输入的文字内容，生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型，加速收敛并提升最终生成。如果你感兴趣，可直接通过官网（快捷方式）查看相关内容。接下来，我们直接快速的切入本文主题吧。

Stable Diffusion文生图模型训练入门实战（完整代码）

SoulmateY的博客

06-17

1万+

（SD1.5）是由Stability AI在2022年8月22日开源的文生图模型，是SD最经典也是社区最活跃的模型之一。以SD1.5作为预训练模型，在火影忍者数据集上微调一个火影风格的文生图模型（非Lora方式），是学习的入门任务。显存要求 22GB左右在本文中，我们会使用模型在数据集上做训练，同时使用监控训练过程、评估模型效果。

使用Mindstudio调用Modelarts进行模型训练

gengu6585的博客

07-17

2238

本文介绍如何使用MindStudio调用ModelArts资源进行模型训练。ModelArts是面向AI开发者的一站式开发平台，而Mindstudio是一个IDE，为AI开发提供了所需的一站式开发环境，结合两者可以高效便捷地完成AI应用开发。...

几行代码实现可视化的文生图采样过程

深度学习机器

12-21

609

Huggingface的实现了端到端的文生图功能，用户输入文字，即可得到最后的图片。但是在某些场景下，如果需要获取中间过程的图片，用于优化长时间等待过程的用户体验，就只能通过修改源码进行实现了。

Meissonic：一个轻量级的文生图模型

最新发布

兴趣使然的创作者

03-30

1107

文生图模型开源之光！ComfyUI - AuraFlow本地部署教程

SJJS_1的博客

12-09

1910

AuraFlow 是唯一一个真正开源的文生图模型，由Fal团队开源，其代码和权重都放在了 FOSS 许可证下。基于 6.8B 参数优化模型架构，采用最大更新参数化技术，还重新标注数据集提升指令遵循质量。在物体空间和色彩上有优势。并支持在线试用和与主流平台集成。未来有望在多领域广泛应用，以开源特色和强大实力吸引更多用户和开发者。下面将介绍AuraFlow的本地部署教程，希望能帮助到大家~

Python 【大模型】之 Deepseek 多模态 Janus 【图生文】【文生图】本地部署/代码调用的简单整理

仙魁XAN

02-11

2065

DeepSeek作为一家年轻而富有活力的AI公司，通过开源策略、创新能力与充足的资源支持，在短短时间内成长为全球瞩目的新锐力量。其核心成员兼具深厚的学术功底与实践经验，所攻关的大模型在数学、代码、生物计算以及语言理解等多方面已展示出强大的竞争力。自成立以来，DeepSeek不断地突破研究瓶颈，先后推出了DeepSeek LLM、DeepSeek V-2和DeepSeek V-3等版本，以极高的性能与成本效益比为业界带来了颠覆性的惊喜。

图片文字的控件ImageTextControl

流苏的专栏

01-12

1381

/// /// 图片文字控件 /// public sealed partial class ImageTextControl : Control { /// /// 需要显示的文字 /// private string _text = string.Empty; ///

图像描述生成（image caption）

poorlytechnology的博客

05-14

5021

图像字幕、图像处理、文本生成

Image-Text Co-Decomposition for Text-Supervised Semantic Segmentation

qq_46221910的博客

10-03

231

hcl。

AI绘画Stable diffusion小白入门：文生图精讲，超全干货一定要看！

A13531922961的博客

05-23

1425

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

AIGC代码学习记录

qq_33596242的博客

07-19

1079

第六步：把c_cat (n,5,64,64)和latent feature (n,4,64,64) 连接起来得到网络的输入 (n,9,64,64)；第六步：根据之前文章的公式对latent feature (n,4,64,64)去燥，得到新的latent feature (n,4,64,64)；第六步：根据之前文章的公式对latent feature (n,4,64,64)去燥，得到新的latent feature (n,4,64,64)；mask img用编码器得到(n,4,64,64)；

在windows下使用本地AI模型提供翻译、对话、文生图服务

omnibots的博客

06-08

6978

OllamaOllluma全面兼容MacOS、Linux和Windows系统，它提供简洁的一键式本地模型部署流程，并将API功能统一转换至与OpenAI相匹配的标准格式，旨在为您带来无缝且高效的使用体验。Docker Desktop 是一个由 Docker Inc. 开发的桌面应用软件，用于在 Windows、macOS 和 Linux 操作系统上运行本地容器。它提供了一种简单且易于使用的界面来启动和管理 Docker 容器，并提供了对一些常用工具（如 Kubernetes）的支持。

weixin_61226361的博客

02-08

1705

SiliconFlow文生图、Python图像生成、AI图片生成、SiliconFlow API

【文生图系列】文生图大模型合集与效果对比