当前位置: 首页 > news >正文

网站开发是怎么样的小码短链接

网站开发是怎么样的,小码短链接,注册网站的软件,去年做啥网站致富ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models TL; DR#xff1a;ControlNet 使得我们能通过输入额外的条件图#xff08;如 Canny 边缘、人体姿态、深度图等#xff09;#xff0c;对 SD 生成结果的空间位置有更准确的控制。它拷贝 SD 部分…ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models TL; DRControlNet 使得我们能通过输入额外的条件图如 Canny 边缘、人体姿态、深度图等对 SD 生成结果的空间位置有更准确的控制。它拷贝 SD 部分原权重作为一个新的分支进行微调训练同时维持 SD 原权重分支不变并在开始训练使用零卷积将二者相连。从而能利用已经在大规模图片数据上预训练的 SD 权重尽量保持原模型能力且训练高效。 方法 模型结构 ControlNet 对 SD 原模型的 adapt 如图所示。图中 x 是输入噪声图y 是输出c 是条件图输入。拷贝一份原参数权重作为另一分支进行训练原参数权重分支不动两分支之间用零卷积链接。所谓零卷积就是权重和偏置都初始化为 0 的 1x1 卷积。这样在训练刚开始时由于零卷积的输出都是 0因此改动后的模型和原 SD 模型的输出是完全一致的。随着训练的进行才会产生变化。这样的结构能保证不会对预训练的 SD 模型带来有害的噪声。 文章以 SD txt2img 为例详细介绍了插入 ControlNet 的方法。原 SD 的 UNet 网络共有 12 层降采样12 层上采样和 1 层中间层。其特征图共有 4 中空间分辨率大小64、32、16、8。ControlNet 对 UNet 的 encoder 部分12 层降采样 1 层中间层构建了可训练拷贝。其输出分别经过零卷积输入给原 SD 模型的解码器部分。 此外SD 是隐层扩散模型LDM其扩散过程时发生在 latent 空间的。输入的条件图自然也需要转换到 latent 空间ControlNet 是使用了四层卷积层完成了这个转换将 512x512 的真实图片转换到 64x64 的 latent 空间。 训练 ControlNet 是在预训练好的模型权重上加入一些参数然后进行微调。其训练的目标函数与 SD 是完全一致的但是加入了各种条件图如 Canny、人体姿势等作为输入。在训练时 ControlNet 时还会有 50% 的概率将文本 prompt 替换为空字符串从而训练 ControlNet 直接识别条件图语义的能力。 作者在训练 ControlNet 时还观察到一个奇特的现象即模型并不是逐渐学习到条件控制能力的而是在某一步突然就会了。如下图模型在 6133 步突然就能精准地按照输入的 Canny 边缘进行生成了。作者称这为 “突然收敛现象” sudden convergence phenomenon。 推理 训练结束之后推理时就可以按照输入的条件图来控制空间位置进行生成了。这里作者还交代了几点细节用于更好地控制生成结果。 CFG-RWSD 在训练时使用了 Classifier-Free Guidance 的方法即同时训练模型条件生成和无条件生成的能力然后在生成时也同时生成条件结果和无条件结果并根据指定的 CFG Scale 得到最终的生成结果 ϵ prd ϵ uc β cfg ( ϵ c − ϵ uc ) \epsilon_{\text{prd}}\epsilon_{\text{uc}}\beta_{\text{cfg}}(\epsilon_{\text{c}}-\epsilon_{\text{uc}}) ϵprd​ϵuc​βcfg​(ϵc​−ϵuc​) 。ControlNet 中条件生成的结果既可以加到 ϵ uc \epsilon_{\text{uc}} ϵuc​ 和 ϵ c \epsilon_{\text{c}} ϵc​ 中也可以只添加到 ϵ c \epsilon_{\text{c}} ϵc​ 中。如果 prompt 为空有 50% 概率此时如果同时加到 ϵ uc \epsilon_{\text{uc}} ϵuc​ 和 ϵ c \epsilon_{\text{c}} ϵc​ 中则相当于没有 CFG 了而如果只加到 ϵ c \epsilon_{\text{c}} ϵc​ 中那么 CFG 引导又太强。这里作者的策略是使用分辨率加权CFG-RW即 w i 64 / h i w_i64/h_i wi​64/hi​ 其中 h i h_i hi​ 是第 i 层的空间分辨率如 h 1 8 , h 2 16 , … h_18,h_216,\dots h1​8,h2​16,… 。 从下图的结果来看嘉乐 CFG-RW 的策略后生成的结果会好很多。 组合多种 ControlNet我们可以对同一次生成组合使用多种 ControlNet并不需要任何加权或插值。如下面的例子就组合了人体姿势和手部的深度图作为条件。 实验结果 略 总结 ControlNet 的影响力不言而喻我们终于能对生成结果的空间位置有精确的控制而不需要再一次次的碰运气。ICCV 2023 Best Paper 实至名归。
http://www.ihoyoo.com/news/49608.html

相关文章:

  • 深圳 购物网站wordpress 去除邮箱
  • 建筑网络工程教程深圳企业股权优化
  • 深圳互助资金盘网站开发网站基本建设
  • 北京网站维护公司装饰工程公司排名
  • 网站开发风险oa信息管理系统
  • 三维立体网站建设乐清问政网络平台
  • 深圳p2p网站开发母婴网站建设前期规划
  • 买外贸衣服的网站快速制作网站的方法
  • 英迈思网站建设奔驰宝马游戏网站建设
  • 阿里云淘宝客网站建设教程网络公司做的网站
  • 网站建设意见建议wordpress停用谷歌字体
  • 做pc端网站包括哪些私人网盘服务器
  • 然后建设自营网站wordpress ftp用户名
  • 需要做网站建设和推广微网站注意事项
  • 陕西网站备案注销wordpress可视化找不着
  • 地铁公司招聘信息网站wordpress 调整页面布局
  • 深圳搭建网站公司四大门户网站
  • 免费网站制作平台下载全国注册信息查询系统
  • 网站建设公司广告 晴天娃娃教育机构做网站素材
  • 成安县城乡建设规划局网站微页制作网站模板免费下载
  • 个人网站建设可行性分析报告怎么里ip做网站
  • 宜春网站推广优化软件定制开发网站建设
  • 怎样用云服务器做网站网站建设方案书是什么意思
  • 为shopify做推广的网站一个主机可以放几个网站
  • 六盘水南宁网站建设论坛
  • 自助网站制作系统源码个人备案放企业网站
  • 嘉兴网站制作哪里好关于集团网站建设申请
  • 精品资源共享课程网站建设论文公司简介ppt模板免费
  • 做网站的带宽现在什么网站做外贸的最好
  • 湘潭学校网站建设 磐石网络专注wordpress 目录迁移