ComfyUI插件:IPAdapter_plus(新版)节点

前言:

学习ComfyUI是一场持久战,而IPAdapter_plus是常用且便捷有效的风格迁移模型,可以通过提供参考图像去进行图像的生成,比如风格迁移,风格融合,人物脸部模拟等各种工作,请大家重点关注本篇内容,深刻理解节点用法!!祝大家学习顺利,早日成为ComfyUI的高手!

目录

一、IPAdapter Advanced/ IPAdapter/ IPAdapter Batch (Adv.)节点

二、IPAdapter Unified Loader FaceID/ IPAdapter Unified Loader/ IPAdapter Unified Loader Community节点

三、IPAdapter FaceID/ IPAdapter FaceID Batch节点

四、IPAdapter Tiled/ IPAdapter Tiled Batch节点

五、IPAdapter Embeds/ IPAdapter Combine Embeds/ IPAdapter Encoder节点

六、IPAdapter Noise/ Prep Image For ClipVision节点

七、“参考人物换装更换”示例工作流

一、IPAdapter Advanced/ IPAdapter/ IPAdapter Batch (Adv.)节点

这三个节点用来将IPAdapter模型的效果注入到大模型中去引导扩散。

输入:

model → 模型

ipadapter → IP适配器

image → 图像

image_negative → 负图像

attn_mask → 注意力掩码

clip_vision → CLIP视觉

参数:

weight → 权重

weight_type → 权重类型

combine_embeds → 合并嵌入 可选项为concat、add、subtract、average、norm average

start_at → 起始位置

end_at → 结束位置

embeds_scaling → 嵌入缩放;默认为'V only',可选项为'V only'、'K+V'、'K+V w/ C penalty'、'K+mean(V) w/ C penalty'

'V only':仅对视觉嵌入(V)进行缩放操作,保持其他嵌入不变。

'K+V':对键(K)和视觉嵌入(V)进行缩放操作,保持其他嵌入不变。

'K+V w/ C penalty':对键(K)和视觉嵌入(V)进行缩放操作,并在缩放过程中对C惩罚,保持其他嵌入不变。

'K+mean(V) w/ C penalty':对键(K)和视觉嵌入(V)进行缩放操作,但是在缩放视觉嵌入时使用均值进行,同时对C进行惩罚,保持其他嵌入不变。

输出:

MODEL → 输出嵌入信息之后的模型

示例:如下图所示,使用SDXL的大模型,对weight_type的四种变化方式进行了测试,可以看出权重类型的不同变换方式对最终图像的生成有很大的影响。

示例:如下图所示,对四种不同的嵌入方式进行了一一实验,大家可自行对比择优选择。

功能:

①IPAdapter Advanced 节点提供了更多高级选项和参数,以实现对图像的精细控制。该节点通常用于需要更精确调整和优化图像的情况。主要功能包括:

· 高级图像处理选项:提供一系列高级图像处理算法和参数,可以对图像进行详细的调整和优化。

· 多种滤镜和效果:允许用户应用多种滤镜和效果,以实现特定的图像风格或增强效果。

· 自定义参数:提供更灵活的自定义参数设置,用户可以根据具体需求调整每个处理步骤的参数。

②IPAdapter 节点是基本的图像处理和调整节点,提供了常用的图像处理功能。适用于大多数普通图像处理任务。主要功能包括:

· 基本图像处理功能:如裁剪、调整大小、旋转、颜色调整等。

· 预设滤镜和效果:包含一些常用的滤镜和效果,用户可以快速应用这些预设来调整图像。

· 参数设置:允许用户对基本参数进行调整,以实现所需的图像效果。

③IPAdapter Batch (Adv.) 节点专为处理大量图像而设计,适用于批量处理场景。主要功能包括:

· 批量处理:支持一次处理多张图像,提高处理效率。

· 高级处理选项:提供与IPAdapter Advanced相同的高级选项和参数,确保批量处理时仍然可以进行精细控制。

· 自动化工作流程:支持自动化设置和参数调整,减少手动操作,提高工作效率。

二、IPAdapter Unified Loader FaceID/ IPAdapter Unified Loader/ IPAdapter Unified Loader Community节点

这三个节点是用来自动加载IPAdapter和其对应的CLIP version模型的,不需要自己对应加载。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置信息

参数:

preset → 预设的模型配置

lora_strength → LoRA 模型的强度参数

provider → InsightFace 模型的提供程序

输出:

MODEL → 输出选择的模型

ipadapter → IPAdapter 模型的配置信息

示例:如下图所示,给出了IPAdapter Unified Loader FaceID的一般用法,该节点可以自动加载对应的lora,clip version和insightface模型,不需要自己进行指定,同理另外两个节点也可以自行适配不需额外的指定。

功能:

①IPAdapter Unified Loader FaceID 节点专为处理人脸识别和人脸数据加载设计,适用于需要对人脸数据进行统一处理的应用场景。主要功能包括:

· 人脸识别加载:能够从数据集中加载人脸图像,确保图像数据格式一致。

· 特征提取:提取人脸特征用于进一步处理或分析。

· 人脸对齐:自动对齐人脸图像,以便后续处理步骤中更容易处理。

②IPAdapter Unified Loader 节点是一个通用的图像数据加载节点,适用于需要统一处理和格式化图像数据的场景。主要功能包括:

· 统一数据加载:从各种来源加载图像数据,并将其格式化为统一的数据格式。

· 基本预处理:包括图像裁剪、调整大小、颜色调整等基本预处理功能。

· 数据规范化:确保所有加载的图像数据都符合统一的规范和标准,方便后续处理。

③IPAdapter Unified Loader Community 节点专为社区数据集设计,适用于加载和处理来自社区的数据集。主要功能包括:

· 社区数据集支持:支持从各种社区来源加载图像数据,例如开源数据集、公共数据集等。

· 数据整合:将来自不同社区的数据集整合为统一格式,便于统一处理。

· 社区特定预处理:提供针对社区数据集的特定预处理选项,确保处理流程优化。

三、IPAdapter FaceID/ IPAdapter FaceID Batch节点

这两个节点是用来识别人物的脸部,然后控制生成的图像跟参考图像的脸部相似,Batch节点可以批量的输入参考图像。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置

image → 图像输入

image_negative → 负图像输入

attn_mask → 注意力掩码

clip_vision → CLIP 视觉模型

insightface → InsightFace 模型

参数:

weight → 权重参数

weight_faceidv2 → FaceIDv2 权重参数

weight_type → 权重类型

combine_embeds → 嵌入组合方式

start_at → 起始位置

end_at → 结束位置

embeds_scaling → 嵌入缩放方式

输出:

MODEL → 输出选择的模型

示例:使用faceID之前,对图片要进行预处理,处理成为224*224的正方形才能提供给视觉编码模型,如果在原始图像中画蒙版,那么蒙版区域与处理后的图像并不贴合,所以会导致生成的图像并不像原图。

示例:ipadapter faceID batch节点可以同时批量处理图像

功能:

①IPAdapter FaceID 节点专为单张人脸图像的处理和识别设计,适用于需要对单个人脸图像进行识别和处理的场景。主要功能包括:

· 人脸检测:识别人脸图像中的面部区域。

· 特征提取:从人脸图像中提取独特的面部特征用于识别。

· 匹配和识别:将提取的面部特征与已有数据库中的特征进行匹配,以识别身份或验证身份。

· 图像预处理:包括图像裁剪、调整大小、对齐和颜色调整等基本预处理操作。

②IPAdapter FaceID Batch 节点专为批量处理人脸图像设计,适用于需要一次处理多张人脸图像的场景。主要功能包括:

· 批量处理:支持一次处理多个图像,极大提高了处理效率。

· 人脸检测和特征提取:与IPAdapter FaceID相同,进行人脸检测和特征提取,但能够同时处理多个图像。

· 批量匹配和识别:对多个图像中的人脸特征进行匹配和识别,适用于大规模人脸识别任务。

· 自动化处理:提供自动化处理选项,减少手动操作,适用于需要高效处理大量人脸图像的场景。

四、IPAdapter Tiled/ IPAdapter Tiled Batch节点

这两个节点可以输入非正方形的图像,然后对整体分块进行参考,让最终生成的图像参考原图的全部信息。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置

image → 图像输入

image_negative → 负图像输入

attn_mask → 注意力掩码

clip_vision → CLIP 视觉模型

参数:

weight → 权重参数

weight_type → 权重类型

combine_embeds → 嵌入组合方式

start_at → 起始位置

end_at → 结束位置

sharpening → 锐化程度

embeds_scaling → 嵌入缩放方式

输出:

MODEL → 输出最终的模型信息

mask → 如果输入有蒙版,会输出分块后的蒙版信息

tiles → 输出分块的结果

示例:

示例:如下图所示,在原图中绘制蒙版,然后将蒙版传入Tiled节点之后,节点会对蒙版也进行相应的裁剪和原始图像一一对应,最终生成的图像只参考蒙版区域进行模仿。

功能:

①IPAdapter Tiled节点用于处理单张大分辨率图像,通过将图像分成多个较小的块进行处理。主要功能包括:

· 图像分块:将大分辨率图像分成多个小块,以便更高效地处理和分析。

· 分块处理:对每个图像块单独进行处理,例如滤镜应用、特征提取等。

· 重组图像:处理完成后将各个图像块重新组合,恢复为完整的图像。

· 处理优化:通过分块处理减少内存消耗和处理时间,适用于处理高分辨率图像或复杂图像处理任务。

②IPAdapter Tiled Batch节点用于批量处理多个分块的图像,适用于需要一次处理多张大分辨率图像的场景。主要功能包括:

· 批量图像分块:支持一次将多张图像分成多个小块进行处理。

· 批量分块处理:对每个图像块进行批量处理,适用于大规模图像处理任务。

· 批量重组图像:处理完成后将多个图像的块重新组合,恢复为完整的图像。

· 高效处理:通过批量和分块处理,显著提高处理效率和资源利用率,适用于需要处理大量高分辨率图像的应用场景。

五、IPAdapter Embeds/ IPAdapter Combine Embeds/ IPAdapter Encoder节点

这三个节点组合使用,分别是对原始图像进行编码处理,合并编码后的结果,编码结果来影响模型的扩散。

输入:

model → 要应用模型的对象

ipadapter → IPAdapter 模型的配置

pos_embed → 正向嵌入

neg_embed → 负向嵌入

image → 图像输入

attn_mask → 注意力掩码

clip_vision → CLIP 视觉模型

embedx → 嵌入的条件信息

参数:

weight → 权重参数

weight_type → 权重类型

combine_embeds → 嵌入组合方式

start_at → 起始位置

end_at → 结束位置

输出:

MODEL → 输出最终的模型信息

embed → 嵌入编码信息

示例:

功能:

①IPAdapter Embeds节点用于从图像中提取特征嵌入,生成用于后续处理或分析的特征向量。主要功能包括:

· 特征提取:从输入图像中提取重要特征,生成特征向量(嵌入)。

· 图像表示:将图像数据转换为低维度的特征向量,以便于后续的处理和分析。

· 多种模型支持:支持使用不同的预训练模型来提取特征嵌入,适用于各种图像处理任务。

②IPAdapter Combine Embeds节点用于将多个特征嵌入进行组合,生成一个新的综合特征嵌入。主要功能包括:

· 特征组合:将多个输入的特征嵌入进行融合,生成一个综合的特征向量。

· 多种组合方法:支持多种特征组合方法,如加权平均、拼接等,适应不同的处理需求。

· 增强特征表示:通过组合多个特征嵌入,提高特征表示的丰富性和鲁棒性,适用于复杂图像分析任务。

③IPAdapter Encoder节点用于对图像进行编码,将图像数据转换为特征嵌入。主要功能包括:

· 图像编码:将输入图像通过编码器模型,转换为特征嵌入。

· 模型训练支持:支持使用预训练模型或自定义训练的编码器模型进行编码。

· 特征表示优化:通过编码过程,优化图像特征的表示,便于后续处理或分析。

六、IPAdapter Noise/ Prep Image For ClipVision节点

这两个节点,一个是用来将原图加上噪声,并可以设置一定的控制方法,比如shuffle,第二个节点是将原始图像进行裁剪去生成适合视觉编码的图像。

输入:图像信息

参数:

type → 噪声类型

strength → 强度

blur → 模糊程度

interpolation → 插值方式

crop_position → 裁剪位置

sharpening → 锐化程度

输出:处理后的图像信息

示例:

功能:

①IPAdapter Noise 节点用于添加或处理图像中的噪声,常用于数据增强或图像处理的特定需求。主要功能包括:

· 添加噪声:在图像中添加随机噪声,以增强数据的多样性,通常用于训练深度学习模型时的数据增强。

· 噪声类型:支持多种噪声类型,如高斯噪声、椒盐噪声等,用户可以根据需要选择合适的噪声类型。

· 噪声强度:允许用户调整噪声的强度,以控制添加噪声的量级和影响。

②Prep Image For ClipVision 节点用于将图像数据预处理为适合ClipVision模型输入的格式和规范。主要功能包括:

· 图像调整:调整图像的尺寸和分辨率,使其符合ClipVision模型的输入要求。

· 图像归一化:对图像数据进行归一化处理,以匹配ClipVision模型的输入规范,通常包括将像素值缩放到特定范围(如0-1或-1到1)。

· 颜色处理:调整图像的颜色通道顺序或进行颜色归一化,以确保输入图像与ClipVision模型的训练数据一致。

七、“参考人物换装更换”示例工作流

熟练使用以上节点,你就可以搭建“参考人物换装更换”的工作流了。

该工作流输入两张图像,一张原始人物图像用来参考脸部和发型,一张一幅图像,用来作为衣服参考,衣服参考图像通过segment anything节点去抠图生成衣服对应的蒙版然后进行embed,人物直接进行embed,人物图像会加入噪声编码后去作为neg embed,然后去控制采样器出图,最终结果如下:

**孜孜以求,方能超越自我。坚持不懈,乃是成功关键。**

ComfyUI插件:IPAdapter_plus(新版)节点的更多相关文章

  1. Ztree插件,定位节点时(focus)不能进入可视区域BUG解决方案

    相关插件版本: jquery.ztree.exedit-3.4.js jquery.ztree.all-3.4.js jquery-1.8.0.js function onAsyncSuccess(e ...

  2. Jstree 使用CheckBox插件 选中父节点时被禁用的子节点也会选中问题

    问题描述: 最近用jstree遇到一个问题,使用CheckBox插件时,当父节点选中时,被禁用的子节点也会选中如下 解决方案: 1.  将jstree升级到最新的版本,v3.3.4及以上就可以 2. ...

  3. 实现一个3D图片轮播插件 —— 更新版

    前言:     前段时间写下了之前那篇 3D图片轮播效果,后来发现了 Pedro Botelho 写的jquery.gallery.js ,于是重新修改了自己的这个图片轮播,使之可以成为一个插件来使用 ...

  4. Elasticsearch-2.4.3的3节点安装(多种方式图文详解)(含 head、kopf、marvel、shield和watcher插件安装和使用)

    前提: Elasticsearch-2.4.3的下载(图文详解) Elasticsearch-2.4.3的单节点安装(多种方式图文详解) 我这里,以192.168.80.10(HadoopMaster ...

  5. 分布式搜索引擎ElasticSearch+Kibana (Marvel插件安装详解)

    在安装插件的过程中,尤其是安装Marvel插件遇到了很多问题,要下载license.Marvel-agent,又要下载安装Kibana 版本需求 Java 7 or later Elasticsear ...

  6. openfire Hazelcast插件集群配置

    原文:http://blog.csdn.net/frankcheng5143/article/details/48708899 注意虽然hazelcast 官方已经有了3.5.2版本,但是openfi ...

  7. 谷歌浏览器中安装.crx扩展名的离线Chrome插件

    一.本地拖放安装 1.下载扩展程序/脚本程序至本地计算机: 2.将其直接拖拽到浏览器的“扩展程序”(chrome://chrome/extensions/)页面. 二.解决“只能通过Chrome网上应 ...

  8. elasticsearch插件大全

    Elasticsearch扩展性非常好,有很多官方和第三方开发的插件,下面以分词.同步.数据传输.脚本支持.站点.其它这几个类别进行划分. 分词插件 Combo Analysis Plugin (作者 ...

  9. KSImageNamed-Xcode插件在xcode 6.4/6.3或其他版本中不能使用解决方案

    大家都知道这个插件很强大,但是现在这个插件最新版貌似只支持xcode7 ,需要修改KSImageNamed-xcode中的一个配置文件,添加uuid才能使他支持xcode6.3或6.4 进入下载的插件 ...

  10. Elasticsearch 5.0 安装 Search Guard 5 插件 (五)

    一.Search Guard 简介 Search Guard  是 Elasticsearch 的安全插件.它为后端系统(如LDAP或Kerberos)提供身份验证和授权,并向Elasticsearc ...

随机推荐

  1. Android 12(S) ALooper AHandler AMessage(二)

    来写个demo试试看到底是ALooper AHandler AMessage是怎么运行的,源文件以及Android.bp如下: // EvenHandler.h #ifndef __MESSAGE_T ...

  2. 用Yacht管理docker容器

    今天是六一儿童节,祝大小朋友们节日快乐! 从今天开始起,防范区的上海市民可以自由出入小区了.始于愚人节,终于儿童节,整整两个月时间,终于迎来了期盼已久的自由和正常. 周一上午的的核酸可能是我们最后一次 ...

  3. ceph客户端配置自动挂载存储服务

    1. 安装支持ceph的内核模块 可选: centos/ubuntu: yum install -y ceph-common 或 apt install -y ceph-common 2. 拷贝认证密 ...

  4. ceph deploy部署ceph集群 ceph扩容 rbd存储

    架构拓扑 节点主机 节点IP 节点角色 OS ceph-admin 10.0.0.60 admin deploy mds centos7 ceph-node1 10.0.0.61 mon osd md ...

  5. js 生成pdf

    最简洁的代码 <script src="js/html2canvas.min.js" type="text/javascript" charset=&qu ...

  6. uniapp 上拉加载下拉刷新

    page.json中配置"enablePullDownRefresh": true //单个页面修改刷新按钮的颜色 "app-plus": { "ti ...

  7. 使用Visual Studio分析.NET Dump

    前言 内存泄漏和高CPU使用率是在日常开发中经常遇到的问题,它们可能会导致应用程序性能下降甚至崩溃.今天我们来讲讲如何使用Visual Studio 2022分析.NET Dump,快速找到程序内存泄 ...

  8. c# 语音识别 | 智能对话

    在.NET4.0中,我可以借助System.Speech组件让电脑来识别我们的声音. 以上,当我说"name",显示"Darren",我说"age&q ...

  9. python pika rabbitmq demo

    import pika import json # https://www.cnblogs.com/zhaohuaxishi/p/12107392.html # https://www.cnblogs ...

  10. python 日志写入文件

    import logging fmt = "%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s: %(message)s" ...