2024年5月13日发(作者:手机安全管家)
changeformer讲解
ChangeFormer是一种基于Transformer和FCN的架构,用于解决变化
检测问题。该模型由三个重要组成部分组成:提取特征的Transformer
Block,计算两张图片差异的Difference Module和根据差异特征生成
变化图的MLP Decoder。
1. 提取特征的Transformer Block
每个提取特征的Transformer Block又分为三部分,一部分是对特征
图下采样,一部分就是经典的自注意力模块,还有一部分是融合了位
置编码的MLP模块。下采样模块的设计思路借鉴了Swin Transformer,
对于每一层的特征图都进行长宽4倍的下采样,在维度层面翻倍。
在ChangeFormer中,Q、K、V是通过reshape的方式来加速计算。
2. Difference Module
Difference Module用于计算两张图片的差异。这个模块首先对两张图
片的特征图进行下采样,然后计算它们之间的差异,最后通过一个卷
积层进行特征提取。这个模块的设计思路是希望通过计算图像之间的
差异来捕捉变化信息。
3. MLP Decoder
MLP Decoder是一个多层感知机,用于根据差异特征生成变化图。这个
模块首先将差异特征进行上采样,然后通过一系列卷积层和激活函数
来生成变化图。这个模块的设计思路是希望通过上采样和卷积操作将
差异特征转化为一个与原始输入图像大小相同的变化图。
发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1715561407a2636937.html
评论列表(0条)