sd基础

工作原理&入门



输入提示词后 有文本编码器将提示词编译成特征向量vae编码器将特征向量传入潜空间内,特征向量在潜空间内不断降噪,最后通过vae解码器将降噪之后的特征向量 解码成一个个像素组成的图片

一般选中默认vae模型



解码编码的模型



CLIP值越大,提前停止的越快,我们提示词被数字化的层数越少,提示词的相关性越小。反之越小越能丰富提示词

CLIP终止层数一般为2

其他功能



1.Hires.fix 高清修复

2.Refiner 当渲染到80% 切换另一个模型渲染

3.CFG 一般为5-10 越小ai越自由,越高越靠近提示词

4.随机种子 提示词一样,随机种子一样则可以在不同电脑生成相同图片

5.迭代步数越高 20-30 图片质量越高,步数过高则失真,且消耗更多时间,有时候还没有效果

ADetailer 修复人物的脸

采样方法 DPM++2M

网站,模型推荐

liblib NovelAI hugingface promlib civitai github
majicmix dreamshaper primemix architectrealmix

提示词 语法

英文和英文的标题符号

权重

数字越高权重越高,画面着重描述什么

[cat]=(cat:0.9)
(cat)=(cat:1.1)
{cat}=(cat:1.05)
[[cat]]=(cat:0.9x0.9)=(cat:0.81)
((cat))=(cat:1.1x1.1)=(cat:1.21)
ctrl + 上箭头 可以快捷调节 权重多低都行,过高则不行,会失真

短句与长句

一个一个词的拼写,而不是一句话呢
一个个词组会更准确,而且好调整权重
提示词控制在75个以内,正反向一样,不超过75

起手式

正向 4k masterpiece 会让图片更加精美
反向则用 text blur之类
有修饰词

提示词顺序,越靠前权重越高

no.1 画质词/画风词
no.2 主题 one girl
no.3 环境/场景/构图
no.4 lora

提示词污染

1girl,blue dress,pink hair,green umbrella,

1girl,blue dress,red hair,puple umbrella,



防止提示词尤其是颜色相互渗透 使用break隔开

提示词融合

1girl,cat  猫在女孩身上
1girl And cat 猫娘 (1girl_cat 有同样效果)
[cat|dog] 也有融合效果
{forest:1girl:0.3} 在30%的时候结束画forest
{forest:1girl:0.7} 在70%的时候结束画forest

图生图&高清修复

通过图片加提示词生成结果



使用预设起手式,并添加进提示词



通过插件来快速选择自己想要的提示词

masterpiece,best quality,1girl,police,glamor,in summer,street,

将参考图拖入图生图并增加提示词

masterpiece,best quality,1girl,police,glamor,in summer,street,coat,

增加提示词coat,通过原图再次生图

图生图重绘幅度,不过高也不过低 0.3-0.5结果图与参考图之间差距不会太大
0.5-0.7赋予ai更多想象空间
低于0.3 或大于 0.7则扭曲变形

局部重绘,增加sunglasses提示词



upscale 二次元

GAN 4X Anime6B 适合动漫放大 (Gan生成式对抗网络简称)

重绘幅度 0.3-0.5安全区间 0.5-0.7ai自由领域

放大倍数x2 512 变为1024

文生图界面



文生图界面的放大需要锁定种子



再次点击小图标来到图生图,再次放大



无需锁定种子

再次放大 模型放大



从512缩放到1024

controlnet

风格转换 softedge

最开始能通过线条处理还原参考图的只有canny

canny 硬边缘 canny将参考图通过细线勾勒出来 架构基于相邻像素计算差值,死板,图片会出现莫名奇妙的元素

softedge 全能模型 将主体勾勒



开启插件controlnet

pidinet 与 hed

hed 保留图片更多细节,完整性好 建筑,场景

pidinet 能够更好保留主体,忽视细节 人物



使用真实系的模型,将二次元图片好好描述

线稿上色 Lineart

lineart多用于线稿上色动漫类图像处理

mj 生成线稿



点击爆炸按钮后,会有去下载插件,如控制台显示git网络失败,手动去下载到相应目录解压



最好宽高比 和原来图片一样 也就是宽度和高度

controlnet-2

openpose 姿态管理



姿态成功控制



dw_openpose_full效果最好

根据参考图图片高宽一致

depth [空间关系]

场景 比如教堂

softedge + depth

控制线条分布 + 深度



depth



预处理用了hedsafe

softedge

负面提示词这里因为是建筑,所以去除finger有关



可以通过提示词来改变教堂颜色

人物

softedge openpose depth ipadapter

线条分布 绑定骨骼 空间关系 面部特征迁移/风格一致性

tile

参考图模糊,再分区块重采样 结果图细节更丰富

可以将图片拖入controlnet的单张图片,再次tile。可以看到叶子的纹路

controlnet Ipadapter

ipadapter 可以去hugingface里下载,根据后缀放在指定目录

换脸

材质迁移

风格迁移

换脸



生成一张图片,为参考图



将参考图拖进ipadapter

写实换脸,上传了自己的图片

材质迁移

ipdapter



softedge



depth



midas也不错

材质很重要,如果用下图材质则使用crystal materials

Ipadapter-1

风格迁移

选择综合性强的大模型 dreamshaper



生成参考图



风格转换 style transfer



点击生成,



生成成功后,高清放大



直接更换风格

甚至可以根据动漫角色的画风,直接变换

ipadapter与openpose综合运用

controlnet unit1 ipadapter

生成骨骼图

controlnet unit2 openpose

写提示词增加lora

要和骨骼图一样比例



有lora则更靠近赫敏的图片

综合案例使用

室内设计

大模型选择 Architecturerealmix



unit 1 mlsd处理完只包含直线



unit 2

生成毛坯房

Unfinished, nothing, no furniture, rough, house interior

精装修

ModernRoomDesign,Interior design,modern simplicity,green,(masterpiece),(high quality),best quality,real,(realistic),super detailed,(full detail),(4k),modern,fashion,grand,vista,(high floor:1.2),



去到图生图



改变关键词然后图生图

如果成品出来还想改变,继续图生图

如果想要壁纸变成自己图片的风格,通过勾选上传独立的控制图像

使用ipadapter,进行渲染

如果没有空间深度则继续使用depth

stable diffusion基础[liblib]

正向提示词

人物特征

1girl,solo,

suspender dress,headdress,delicate eyes,beautiful face,shallow smile,snow-white skin,elegant standing,

场景特点

outdoor,blue sky,white clouds,flowers,grass,

场景设定 [天气与光线与白天和黑夜]

day,night sunset,rain shrong rim light

movie light,light tracking,

场景形容词

beautifful ,happy

生图标准 [画质与风格]

8k,highest quality,high resolution

Comic Watercolor Realistic Abstract

1girl,solo,
suspender dress,headdress,delicate eyes,beautiful face,shallow smile,snow-white skin,elegant standing,
outdoor,blue sky,white clouds,flowers,grass,
movie light,light tracking,
beautiful,happy,
8k,highest quality,high resolution,
realistic,extreme detail

负向

low quality,blurry,bad proportions,cropped,watermark

ugly,bad body,missing fingers,extra feet

NSFW text logo

参数

eular a画笔选择,根据推荐来,其实都差不多

步数15-25,过高也不会有用

comfyui尝试

sd 挂lora+汉化工作流

图片有元数据

可以通过拉取图片来获得工作流

comfyui 大部分问题可以通过离线安装的方式解决 google可以解决。每当报错

通过日志去查看,工作流报红,缺模型就安装模型,缺插件安装插件,缺什么装什么

stable diffusion 入门教程的更多相关文章

  1. Stable Diffusion魔法入门

    写在前面 本文为资料整合,没有原创内容,方便自己查找和学习, 花费了一晚上把sd安装好,又花了大半天了解sd周边的知识,终于体会到为啥这些生成式AI被称为魔法了,魔法使用前要吟唱类比到AI上不就是那些 ...

  2. Stable Diffusion 关键词tag语法教程

    提示词 Prompt Prompt 是输入到文生图模型的文字,不同的 Prompt 对于生成的图像质量有较大的影响 支持的语言Stable Diffusion, NovelAI等模型支持的输入语言为英 ...

  3. AI 绘画咒语入门 - Stable Diffusion Prompt 语法指南 【成为初级魔导士吧!】

    要用好 Stable Diffusion,最最重要的就是掌握 Prompt(提示词).由于提示词对于生成图的影响甚大,所以被称为魔法,用得好惊天动地,用不好魂飞魄散 . 因此本篇整理下提示词的语法(魔 ...

  4. CTF必备技能丨Linux Pwn入门教程——格式化字符串漏洞

    Linux Pwn入门教程系列分享如约而至,本套课程是作者依据i春秋Pwn入门课程中的技术分类,并结合近几年赛事中出现的题目和文章整理出一份相对完整的Linux Pwn教程. 教程仅针对i386/am ...

  5. CTF必备技能丨Linux Pwn入门教程——利用漏洞获取libc

    Linux Pwn入门教程系列分享如约而至,本套课程是作者依据i春秋Pwn入门课程中的技术分类,并结合近几年赛事中出现的题目和文章整理出一份相对完整的Linux Pwn教程. 教程仅针对i386/am ...

  6. CTF必备技能丨Linux Pwn入门教程——环境配置

    说在前面 这是一套Linux Pwn入门教程系列,作者依据Atum师傅在i春秋上的Pwn入门课程中的技术分类,并结合近几年赛事中出现的一些题目和文章整理出一份相对完整的Linux Pwn教程. 问:为 ...

  7. AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵

    作者:韩信子@ShowMeAI 深度学习实战系列:https://www.showmeai.tech/tutorials/42 自然语言处理实战系列:https://www.showmeai.tech ...

  8. wepack+sass+vue 入门教程(三)

    十一.安装sass文件转换为css需要的相关依赖包 npm install --save-dev sass-loader style-loader css-loader loader的作用是辅助web ...

  9. wepack+sass+vue 入门教程(二)

    六.新建webpack配置文件 webpack.config.js 文件整体框架内容如下,后续会详细说明每个配置项的配置 webpack.config.js直接放在项目demo目录下 module.e ...

  10. wepack+sass+vue 入门教程(一)

    一.安装node.js node.js是基础,必须先安装.而且最新版的node.js,已经集成了npm. 下载地址 node安装,一路按默认即可. 二.全局安装webpack npm install ...

随机推荐

  1. mysql笔记第一天: 介绍和MySQL编译安装

    一.DBA的工作内容: ![](371eaced-e10b-46d9-89e2-f63f15503bb6_files/9edcd22a-ef2d-4c3e-8474-3049255610db.jpg) ...

  2. 箭头函数中的this指向

        // 箭头函数中的this指向         //     如果是箭头函数,this指向是,父级程序的,this的指向         //       如果父级程序是一个函数,函数也是有t ...

  3. SCOI 回旋退役记

    02.21 day -2 开始写了,期望这不是真的退役记吧.但是不是的概率好小-- 这几天一直考试,怎么说呢,到差不差的,也就那个样子. 归根结底,菜是原罪,和那些大佬相比我真的很很很菜啊.当时看 c ...

  4. kettle从入门到精通 第五十课 ETL之kettle 课程源文件分享

    Kettle 是一款功能强大的开源 ETL 工具,被广泛应用于数据集成.数据转换和数据加载等领域.随着数据量和多样性的不断增加,使用 Kettle 进行数据处理已成为许多企业和数据工程师的首选.在过去 ...

  5. 使用 JavaScript 脚本来进行复杂的查询改写

    有这么一个需求: 网关里怎样对跨集群搜索进行支持的呢?我想实现: 输入的搜索请求是 lp:9200/index1/_search 这个索引在 3 个集群上,需要跨集群检索,也就是网关能否改成 lp:9 ...

  6. Java学习笔记 - 单例模式

    概述 单例模式是一种创建者模式.当我们需要确保系统中某个类仅能存在一个对象时,比如:全局信息类例如当项目启动时我们将一个配置文件读取为一个Config类的实例从而在业务逻辑中通过操作对象读取配置.无状 ...

  7. Vue学习:1.V标签综合1

    认识V标签 目录 认识V标签 v-text: v-html: v-bind (缩写为 :): v-if / v-else / v-else-if: v-show: v-for: v-model: Vu ...

  8. OAuth + Security - 7 - 异常翻译

    认证异常翻译 默认情况下,当我们在获取令牌时输入错误的用户名或密码,系统返回如下格式响应: { "error": "invalid_grant", " ...

  9. json 对象属性的输出顺序测试,fastJson 有序,jackson,gson无序(需代码中人工按约定来编码)接口数据签名规则

    json 对象属性的输出顺序测试,fastJson 有序,jackson,gson无序(需代码中人工按约定来编码)接口数据签名规则 fastJson会根据对象的字段的首字母来排序.而jackson,g ...

  10. gradle dependencies 查找jar导入OR解决jar冲突

    在gradle项目中,使用gradle dependencies先查询jar包的导入关系.然后找到导入的jar加入到项目中来.解决jar冲突等问题. 类似格式如下: annotationProcess ...