亦束的头像

Stable Diffusion 使用基础流程——AI无损放大

Extras
3
Extras
处理方式
处理方式
处理算法
处理算法
面部修复
面部修复
PNG Info
PNG Info
处理方式
处理方式
操作
操作
倍数放大
倍数放大
宽高放大与裁剪
宽高放大与裁剪
倍数
倍数
宽高
宽高
Upscaler1
Upscaler1
模型效果
模型效果
通用模型
通用模型
Upscaler2
Upscaler2
Upscaler2visibility
Upscaler2visibility
对比算法
对比算法
面部修复
面部修复
透明度
透明度
混合量
混合量
CodeFormer权重
CodeFormer权重
png信息
png信息
识别
识别
单集封面
单集封面

Stable Diffusion 使用基础流程——AI无损放大

2023-06-01
158 次观看
亦束的头像
亦束
粉丝:180
主题:5
描述:10
例子:7
类比:1
其他:1
字数:2012

Stable Diffusion 使用基础流程——AI无损放大

2023-06-01
158 次观看
亦束的头像
亦束
粉丝:180
亦束的头像
亦束
粉丝:180
主题:5
描述:10
例子:7
类比:1
其他:1
字数:2012

Extras

引言 序

大家好,我是亦束,本期内容讲扩展界面的功能。

处理方式

处理方式

Single Image ,顾名思义就是单个图像处理。Batch Process 为批量处理,在这个上传框里你可以把多个图像拖入进来,然后进行处理。Batch from Directory 则是根据你填写的目录,将输入目录里的所有图像作为要处理的图像,输出目录作为处理完成的图像存放位置,来批量处理,Show result images就是预览你处理完成的图。

操作 处理方式

上传图片跟图生图是一样的,拖入或点击空白处上传。在 Single Image 里只能拖入一张,生成的位置在 Extras 文件夹里。Batch Process 可以放进多张图片,生成的位置也是放在 Extras 文件夹里。Batch from Directory填写图像的输入和输出路径,生成的位置就在你输出路径位置。

倍数放大

Scale by 为倍数放大,按照你上传图片的大小再乘以你设定的这个倍数大小。

宽高放大与裁剪

Scale to 以你设定的宽高来放大,你设定的多少它就放大多少,勾选上 Crop to fit ,当图像宽高比与设定的不一致时,会预先按照比例裁剪,然后放大。不勾选上 Crop to fit则它会以“宽”为主导进行像素的放大,如果宽高与原图的宽高且比值都不一致时,以“宽”为主进行等比缩放,当宽一致高不一致,则以“高”为主进行等比缩放。

倍数 倍数放大

我们上传一张 512 * 512 的图像,用默认的 Scale by 数值 4 来生成一下,先随便选一个模型。可以看到最后的图像放大了 4 倍,变成了 2048 * 2048 。

宽高 宽高放大与裁剪

我们将 Scale to 的宽高设定为 1024 * 1024 ,然后生成,最后的图像也是 1024 * 1024 。

我们再将它设置为 1024 * 512 ,在勾选 Crop to fit 的情况下,可以看到它的高被裁剪了。

然后我们取消勾选,上传一张 512 * 512 的图像,设定为 548 * 513 ,生成的结果是 548 * 548 。

设定为 512 * 548 ,生成的结果也是 548 * 548 。

处理算法

Upscaler1

放大模型算法1,这里我就讲几个我常用的通用模型,其它的模型你想要了解可以去文本区,点击链接去了解,里面有针对不同类型图像专用的模型介绍。

模型效果 通用模型

我们用各个模型来对比一下原图和放大的区别,在图像类别上分别用动漫和写实进行对比。

通用模型
  • LDSR:基于SD的技术,速度非常慢且吃显存,修改一点颜色。适合摄影类图像的放大,不常用。

  • ESRGAN_4x:基于 GAN (生成对抗网络),生成的图过于锐利。

  • R-ESRGAN 4x:ESRGAN_4x 的增强版,针对于摄影图,绘图都有不错的效果。

  • R-ESRGAN 4x+ Anime6B:针对二次元图像的放大,效果不错。

  • 4x-UltraSharp:也是基于 ESRGAN_4x 训练的模型,适用于大部分图像,效果也很好。这也是我最常用的模型,但在默认选项里是没有这个的,需要自行下载并放进 ESRGAN 文件夹内。

  • SwinIR_4x:基于 Transformer 的模型,生成的图形比较平滑,效果也还可以。

Upscaler2

放大模型算法 2 ,目前没有找到官方的信息,普遍认为算法 2 选择了模型,那么第一个算法用来补充细节,第二个算法用来平滑图像。

Upscaler2visibility

visibility,普遍认为它是作为算法的混合量。

对比算法 Upscaler2

算法 1 先选用 4x-UltraSharp,2 不开启来生成一张。然后再将算法 2 选用 SwinIR ,混合量 0.5 生成一张,来对比一下区别。

面部修复

面部修复

下面几个选项都是针对面部修复的功能,两个功能选一个使用就行了。Visibility 和之前 算法2 visibility的概念是一样的,如果你开到 0.5 会产生叠加的效果。

透明度

你可以把它当做图生图里的透明度来理解,不过这里的数值与透明度的数值是反过来的。

混合量 面部修复

我们拿张图来测试,值为 0 时,为原始图,而值为 1 时,是修复图。当值为 0.5 时,会产生原始图和修复图叠加。

CodeFormer权重

下面一个面部修复功能还有个权重的选项,值为 0 时代表面部修复功能影响程度最高,在括号里也已经提示了。

PNG Info

png信息

PNG Info ,用来识别 SD 生成图像的参数。

识别 png信息

我们拖入一张由 SD 生成的图像,在右边可以看到所有的参数,例如正负提示词,使用的模型,算法等,甚至连后期扩展用的处理算法和放大的大小都有。如果我们拖入的不是 SD 生成的图像,那它只显示了一个 dpi 的数值。

[BGM]:Roa - Winter 【Official】

讨论
随记