亦束的头像

Stable Diffusion 基础使用教程-文生图

文生图
2
文生图
插件
插件
结尾
结尾
引言
引言
txt2image
txt2image
模型选择
模型选择
切换模型
切换模型
正提示词
正提示词
动漫小女孩
动漫小女孩
负提示词
负提示词
差艺术
差艺术
采样算法
采样算法
采样步数
采样步数
width与height
width与height
生成
生成
动漫女孩
动漫女孩
CFGscale
CFGscale
CFG为2
CFG为2
CFG为24
CFG为24
批数量与大小
批数量与大小
女孩
女孩
seed
seed
改图
改图
Restorefaces
Restorefaces
Tiling
Tiling
平铺
平铺
Hires_fix
Hires_fix
单集封面
单集封面

Stable Diffusion 基础使用教程-文生图

2023-04-09
438 次观看
1 讨论
亦束的头像
亦束
粉丝:180
主题:3
描述:14
例子:9
其他:1
字数:2015

Stable Diffusion 基础使用教程-文生图

2023-04-09
438 次观看
1 讨论
亦束的头像
亦束
粉丝:180
亦束的头像
亦束
粉丝:180
主题:3
描述:14
例子:9
其他:1
字数:2015

文生图

准备 引言

各位好,我是亦束,这期视频我将带大家了解Stable Diffusion WebUI内建的文生图用法。如果还没安装Stable Diffusion WebUI的可以点击下方字幕,跳转到安装教程,将SD安装至电脑上。

txt2image

文生图txt2image即让AI按照文字描述画出图像,流程是填入提示词,调整生成时的参数,在点击生成。其余SDWebUI功能的大抵都是按照此流程设计。

模型选择

在左上方可以看到一个SD checkpoint的选项,这个地方可以看到你选择的模型,也可以在这个位置切换模型。切换模型需要等待几十秒的时间。

切换模型 模型选择

我们也可以在日志里看到它的加载时间。

正提示词

第一个框是写正向提示词,你想让它画什么,就在这个框内输入相关提示词。

动漫小女孩 正提示词

例如,我们让它生成一个动漫小女孩。先给它要生成的图像内容,然后我们加入一些与其相关的提示词,如质量高,细节多,模仿谁的风格等之类的提示词,这样它能有更多的信息画出你想要的内容。(Create a high resolution artwork of lofi , Anime Little Girl who is curious and adventurous child, always eager to explore and discover new things, by makoto shinkai and ghibli studio, highly detailed, incredible quality, trending on artstation, masterpiece, 8k)

负提示词

第二个框填负提示词,你不想它画出什么内容,就在这里添加不想要的提示词。

差艺术 负提示词

例如,我不想让它生成差的艺术作品,丑的,差的设计等(bad artist, poor, ugly, bad anatomy, poor drawing, bad design)

采样算法

这里是采样算法,每个算法得出的结果都不一样,我比较喜欢DPM++ 2M Karras,因为它很好的平衡了速度和质量。这一块就不做演示了,可以自己去试试,关于各种算法的作用区别,我之后会翻译一些相关文章出来分享。

采样步数

然后这里是采样步数,即去噪过程的步数,一般都调在30左右就够了,数值到达某个值之后,数值越大,性能损耗越多,效果提升越小。这个得根据生成的内容调整到一个合适的值。

width与height

这个是图片的尺寸,尺寸越大品质越好,越吃性能。当然,因为训练图像的关系,长宽比也会影响生成的效果,能达到更好效果的长宽比可以参考这个

生成

点击右上角的Generate开始绘图,生成的速度看你显卡性能。

动漫女孩 生成

可以看到它已经绘制出来了一个动漫小女孩。

CFGscale

CFGscale,用于控制模型应在多大程度上更靠近你的描述内容,越大越靠近,越小越放飞自我。常用参数在7-11之间,关于各个值的偏向如下

  • 1 - 几乎忽略你的提示。

  • 3 - 更有创意。

  • 7 - 遵循提示和自由之间的良好平衡。

  • 15 - 更加遵守提示。

  • 30 - 严格按照提示操作。

CFG为2 CFGscale

我们继续用前面的动漫女孩,然后试试2的参数值看什么效果。

CFG为24 CFGscale

试试24达成的效果。

批数量与大小

接着往下,这个是批数量(Batch count),算多少次图。这个是批大小(Batch size),每次同时算多少张图。

女孩 批数量与大小

我们还是用之前的关键词,然后调整一下这些参数,来看看是如何生成的。我们把Batch count设置为3,Batch size设置为2。可以看到它生成了3次,每次同时生成了2张。

seed

seed,用于在潜在空间中生成初始随机张量的种子值。实际上,它控制图像的内容,生成的每个图像都有自己的种子值。值为 -1 时随机。

改图 seed

还是用我们之前生成的动漫女孩图像,在右边的图像下方有生成它的所有参数,我们将所有参数调整为一样,将种子的数值拷贝到框里,或者点击这个按钮。接着在提示词框里增加帽子的提示词,最后生成。可以看到这个动漫小女孩戴上了帽子。

插件

我们回到中间可以看到三个选项

Restorefaces

第一个脸部修复模型,用来修复真人脸部的,你如果要生成真人的图像就可以勾选它。

Tiling

第二个是平铺花纹,就是生成可连续花纹的图片。

平铺 Tiling

我们勾上试一下,可以看到类似地板一样重复连续的花纹效果。

Hires_fix

最后第三个是消耗显存提高图像的画质。

结尾

好了,本期内容到此结束,这期主要讲的就是文生图的基本使用流程,里面有些参数的作用和工作原理都没有去拓展,这些内容我以后会去找一些比较优质的内容翻译,并发布在这个帐号上,大家可以关注一下。下一期讲图生图的基本使用流程。

BGM: 无心吉他翻弹 - 群青グンジョウ

讨论
随记