012_SSS_ Improving Diffusion Model Efficiency Through Patching

admin•2025-09-17 03:19:12•网站建设•阅读16

Improving Diffusion Model Efficiency Through Patching本文主要是在思路上比较具有创新性. Diffusion需要成百上千的采样步, 这是Diffusion采样速度慢的重要原因. 因此,

Improving Diffusion Model Efficiency Through Patching

本文主要是在思路上比较具有创新性. Diffusion需要成百上千的采样步, 这是Diffusion采样速度慢的重要原因. 因此, 很多加速Diffusion的方法关注于如何降低采样步数. 本文的作者则提出了另一种思路, 也就是通过将图像划分patch降低Diffusion模型每一步的采样效率和内存占用量.

1. Introduction

对于图像数据, 降级计算成本的一种很高效的方法就是处理图像数据的低维表示, 这种低维表示可以通过降采样或者编码器得到, 但是这两种方式还需要将低维的数据上采样或是解码器解码出来, 需要更多的网络. 本文采用了一种更方便的做法, 也就是将图像划分成patch然后直接concatenate起来.

本文作者的主要贡献:

对Diffusion训练目标进行深入分析, 表明在很多的采样步中, 高分辨率的卷积层是冗余的.
提出了一种Patched Diffusion Model(PDM), 而且证明可以明显降低采样的代价. 而且这种方法可以与现有的降低采样步的方法同时使用.
作者对不同训练目标的Diffusion效果进行比较, 发现不论是否有patch, 通过预测数据的方法比预测噪声的方法模型更鲁棒.
作者提出了一种将PDM用于更复杂,分辨率更高的数据的方法, 也就是将一个网络分为多个部分, 然后在256x256的ImageNet上可以得到高质量的结果.

2. Patch Diffusion Model

Diffusion模型的原理不再赘述, 只是这里作者用的标记与DDPM不太一样, 放张图一目了然.

训练的目标, 也就是重建出x

这里的 γt\gamma_tγt 是常数. 但是训练的时候如果目标加入了 γt\gamma_tγt 反而会导致采样的质量下降, 因为会 overemphasize 高频的信息. 所以作者在文中设置 γt=αt1−αt\gamma_t = \sqrt{\frac{\alpha_t}{1-\alpha_t}}γt=1−αtαt, 来兼顾低频的信息.

Diffusion的训练过程, 也就是将 x 进行 perturb 得到 ztz_tzt, 然后训练网络 xθx_{\theta}xθ 通过 ztz_tzt 重建出 x, 也就是上面图中训练目标.

2.1 Diffusion模型架构中的冗余

作者指出, 对于任意一个隐变量 ztz_tzt, 可能是很多的不同的 xxx 加入不同的噪声得到的. 但是这些 xxx 都能对应于这个 ztz_tzt, 只是概率不同. 这种情况在 t 比较大, 也就是噪声比较大的时候更明显. 怎么理解呢?

如图三个苹果颜色不同形状完全相同, 那么通过上边的隐实验结果分析：变量(也就是近似于噪声的图像)预测得到的 x 可能是这三个苹果中的任何一个. 在这种情况下, 模型优化后会得到的最优的结果是什么呢?

作者指出, 通过上面训练目标进行优化得到的最优的结果可以表示为:

推导的过程如下:

简而言之, 也就是说模型每一步收敛到最优的时候, 预测得到的 x∗x^*x∗ 是输入的 ztz_tzt 对应的所有的所有 xxx 的期望, 或者也可以看作是均值. 代入刚才的苹果例子里边, 模型预测的苹果会是三种颜色的一种平均. 这其实和众多用L2损失进行优化的情况相似, 也就是模型最终学到的是所有可能情况的均值, 从而会丧失diversity. 不仅体现在着色模型会倾向于将结果预测成灰色, 还体现在Diffusion模型可能会在预测时高频的信息会很模糊, 因为取的是平均值.

但是作者并没有说怎么解决模糊的问题, 而是基于这种模糊的事实, 指出既然在噪声比较大的时候直接预测的 x 是模糊的, 也就是高频信息并不能很好的得到, 那么就不需要那么高的计算代价, 反正都是模糊的. 于是就不需要在高分辨率上去做卷积.

2.2 Patched Diffusion Models(PDM)

首先来说作者怎么分Patch操作, 对于(H, W, C)的图像, 作者将其按照 P 的大小分成不重叠的Patch, 然后concatenate起来, 于是就将图像转变为 (H/P,W/P,C×P2)(H/P, W/P, C \times P^2)(H/P,W/P,C×P2) 的数据, 这个作为Unet的输入.

作者尝试了不同的patch大小2,4,8. 发现patch=4的时候, 既能有比较好的采样质量, 又能提高速度. 并且作者通过比较不同patch的RMSE证实了在噪声比较大时, 高分辨率做卷积是没多大用的.

之后作者尝试了不同的训练目标, 也就是重建 ϵ\epsilonϵ, xxx, αtϵ−1−αtx\sqrt{\alpha_t} \epsilon - \sqrt{1-\alpha_t} xαtϵ−1−αtx三种不同的目标对质量的影响. 结论是重建 xxx, αtϵ−1−αtx\sqrt{\alpha_t} \epsilon - \sqrt{1-\alpha_t} xαtϵ−1−αtx 比重建 ϵ\epsilonϵ 更鲁棒.

2.3 Scaling to more complex datasets

这个部分很简单, 就是用了两个Unet, 一个不分patch用在前半部分模糊的阶段, 另一个用在后半部分.

更多实验结果参考原文.

发布者：admin，转转请注明出处：http://www.yc00.com/web/1755028368a5228642.html

admin

建站资讯
Model
admin
2023-7-16
470
建站资讯
成功解决 params, model
admin
2023-11-16
330
网站建设
解密AI绘画与修图： Stable Diffusion+Photoshop
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛
admin
9月前
250
网站建设
Stable Diffusion电脑配置选购指南
前言正好有朋友问到我SD电脑配置，就简单写一下我的观点和经验吧。SD的图像生成主要依赖的是显卡。只要显卡显存足够，就能够出图，其他的不太差就行。之前见过文章分析&am
admin
9月前
270
网站建设
Windows环境使用整合包与手动部署Stable Diffusion详细流程
文章目录前言1. 本地部署Stable Diffusion Web UI1.1 整合包安装1.2 手动安装Stable Diffusion Web UI 2. 安装Cpolar内网穿透3. 实现公网访问Stable Diffusion W
admin
7月前
220
网站建设
【工具推荐】超火AI绘图Stable Diffusion Web UI本地部署与远程访问教程
【工具推荐】超火AI绘图Stable Diffusion Web UI本地部署与远程访问教程前言1. 本地部署Stable Diffusion Web UI 1.1 整合包安装1.2 手动安装Stable Diffusion Web UI
admin
5月前
360
网站建设
Stable Diffusion AI 4.8.7软件安装包下载及安装教程
软件下载 1.软件名称：Stable Diffusion AI 2.软件版本：4.8.7 3.软件大小：16.52 GB 4.安装环境：win7w
admin
5月前
240
网站建设
【stable diffusion 】AI绘图电脑配置要求与电脑主机配置推荐
Stable Diffusion是基于人工智能技术开发的绘画工具，用户可以根据任意文本输入生成高质量、高分辨率的逼真图像。目前Ai绘画火爆，不少用户咨询我们关于Ai绘画的配置要求和电脑配置方案&a
admin
4月前
470
网站建设
《Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation》论文解读
本文提出DiffewS框架旨在释放扩散模型在few-shot 语义分割中的潜力首先明确了将扩散模型应用于少射语义分割的四个关键问题：如何促进查询图像和支持图像之间的交互？如何有效地整合来自支持
admin
1月前
190
网站建设
终极免费 Photoshop 插件，使用 Stable Diffusion！简单快捷！
Stable Diffusion Photoshop 插件安装及使用指南本文介绍了名为 stable.art 的 Photoshop 插件，它基于 Stable Diffusion 模型，可以
admin
1月前
190
网站建设
Model Context Protocol (MCP) 简介
Model Context Protocol (MCP) 简介文章目录 Model Context Protocol (MCP) 简介 Why MCP? General architecture Introduction Why MCP?
admin
1月前
260
网站建设
【Stable Diffusion】提示词自动翻译插件prompt-all-in-one
在Stable Diffusion中，我们输入的提示词只能识别英文的。如果使用的秋叶整合包的话，里面是已经包含了一个提示词联想插件的。比如我们输一个“1”，就能看到下方联想
admin
1月前
130
网站建设
【设计模式】使用unity实现策略模式（strategy model）
demo下载地址： https:githubEagle-LaiDesignModetreemasterStrategy 阅读《大话设计模式》后，自己根据unity的特性写的一个简单d
admin
1月前
130
网站建设
Vue脚手架报错：‘v-model‘ directives require no argument 解决方案
1、报错：v-model directives require no argument 截图2、原因：ESLint对vetur进行了eslint检查3、解决方法① 修改模板中使用v-show将 v
admin
1月前
210
网站建设
缺陷或负样本难以收集怎么办？使用生成式模型自动生成训练样本，image-to-image Stable diffusion
文章大纲样本稀疏与对应的解决方案 1.数据层面 2.模型层面 3.方法层面如何解决工业缺陷检测小样本问题参考1：AIDG(Artificial Intelligent Defect Generator) 参考2：灵感来源 : Imag
admin
1月前
190
网站建设
一文读懂：世界模型(World Model)
世界模型（World Model）是人工智能算法模型的一种新概念，旨在模仿人类和动物通过观察与交互自然地学习关于世界运作方式的知识。这一理念由深度学习之父杨丽坤Yann
admin
1月前
290
网站建设
polyhedral model schedule tree
前言当前主流的基于polyhedral model的deep learning compiler 例如Tensor Comprehensions（Tensor Comprehensions: Framework-A
admin
1月前
260
网站建设
论文阅读——LSQ+: Improving low-bit quantization through learnable offsets and better initialization
LSQ: Improving low-bit quantization through learnable offsets and betterinitializationfrom Qualcomm AI Research | Seou
admin
1月前
170
网站建设
012_SSS_ Improving Diffusion Model Efficiency Through Patching
Improving Diffusion Model Efficiency Through Patching本文主要是在思路上比较具有创新性. Diffusion需要成百上千的采样步, 这是Diffusion采样速度慢的重要原因. 因此,
admin
1月前
170
网站建设
第一课-前提-Stable Diffusion 教程
首先介绍下这个系列课程：Stable Diffusion 是一个流行的 Ai 绘图工具。简称 SD。这个课程将手把手教会你如何使用 SD 绘图。课程内容：学习完这个系列课程，
admin
1月前
200

发表回复

评论列表（0条）

暂无评论

012_SSS_ Improving Diffusion Model Efficiency Through Patching

Improving Diffusion Model Efficiency Through Patching

1. Introduction

2. Patch Diffusion Model

2.1 Diffusion模型架构中的冗余

2.2 Patched Diffusion Models(PDM)

2.3 Scaling to more complex datasets

发表回复

评论列表（0条）

联系我们

400-800-8888

012_SSS_ Improving Diffusion Model Efficiency Through Patching

Improving Diffusion Model Efficiency Through Patching

1. Introduction

2. Patch Diffusion Model

2.1 Diffusion模型架构中的冗余

2.2 Patched Diffusion Models(PDM)

2.3 Scaling to more complex datasets

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888