开·云体育app下载安装 对卷积的困惑
对卷积的困惑
很早以前就曾经学过卷积这一概念,然而始终都没能弄明白。教科书一般会给出其定义,还会给出诸多性质,也会运用实例以及图形来加以解释,可是,究竟到底为何要如此这般予以设计,又如此这般来进行计算,其背后所蕴含的意义到底是啥,常常都是说得含糊不清。身为一个出身于物理专业的人,要是一个公式无法给出契合实际的、直观的、通俗易懂的解释(也就是背后的“物理”含义),就会感觉好像缺了些什么,感觉并非是真正理解了。
教科书上一般定义函数
的卷积
如下:
连续形式:
离散形式:
并且,还解释了,要先对g函数做翻转,这等同于在那数轴之上,将g函数从右边往左边褶过去,而这也就是卷积当中“卷”的由来之处了。
接下来,将g函数朝着n的方向进行平移,于该位置把两个函数的对应点予以相乘,随后实施相加操作,此过程便是卷积的“积”的进程。
这项内容仅仅是以计算的途径针对公式予以了阐释,就数学层面言毫无瑕疵,然而进一步加以追问,为何要先行翻转而后平移,这般设计有着怎样的意图,依旧是稍显难以理解。
于知乎之上,已然有着诸多热心的网友,针对卷积列举了林林总总的形象示例来予以阐释,诸如卷地毯,丢骰子,打耳光,存钱呀等等。阅读完毕后觉着极为生动且饶有趣味,然而细细思索一番,却仍是感觉存在一些方面没能解释得清晰透彻,甚而或许还存有瑕疵之处,又或者是能够加以改进的(关于这些后续我会展开一番分析)。
脑子里边带着那些问题,苦苦思索了两个夜晚,最终才感觉一些问题算是理清头绪恍然大悟想透彻了,于是呀就把它写下来拿去跟网友们来相互告知分享,一块儿学习一块儿提升进步。其中存在不对的地方,请你们欢迎发表评论毫不留情地批评指正哈。
明确一下,这篇文章主要想解释两个问题:
1. 怎样去解释卷积这个名词呢 “卷”所指代的是什么意思呢 “积”所表述的又是什么名堂呢。
2. 卷积背后的意义是什么,该如何解释?
考虑的应用场景
为了更好地理解这些问题,我们先给出两个典型的应用场景:
1. 信号分析
存在一个输入信号f(t),它经过一个线性系统,该线性系统的特征能够用单位冲击响应函数g(t)来描述 ,如此一来输出信号会是什么呢?实际上借助卷积运算便能够得到输出信号句号。
2. 图像处理
输入一幅图像f呀,将其经过特定设、计的卷积、核g诶,进行卷积处、理以后,输出图像将会得到模糊,边缘强化等各、种效果。
对卷积的理解
什么是对卷积这个名词的理解呢,即为,所谓两个函数进行的卷积,本质为何呢就是,要先把其中一个函数朝着相反方向翻转,之后呢再去进行滑动叠加。
处于连续情形时,叠加所指的是针对两个函数的乘积开展求积分操作,于离散情形下那便是加权求和了,为了达到简单的目的kiayun手机版登录打开即玩v1011.速装上线体验.中国,便将其统一称作叠加。
整体看来是这么个过程:
转换为,先进行翻转,之后开展滑动,再实施叠加,接着又进行滑动,随后再次叠加,然后继续滑动,还要叠加,如此不断循环下去哦。
多次滑动得到的一系列叠加值,构成了卷积函数。
卷积之中的“卷”,指向函数的翻转之事,即从g(t)蜕变至g(-t)这一进程;并且,“卷”还存有滑动之意蕴(此乃汲取网友李文清之建议)。倘若将卷积译作“褶积”,那么这个“褶”字仅有翻转的寓意所在了。
卷积的“积”,指的是积分/加权求和。
某些文章单单注重滑动叠加求和,却并未阐述函数的翻转,我觉着这不周全;部分文章对于“卷”的理解实际上指的是“积”,我认为这是搞错了相互关系,弄混了。
对卷积的意义的理解:
1. 从“积”的这个过程能够看出,我们所获取的叠加值,它是一个全局性质的概念。拿信号分析当作例证,卷积所产生的结果,它不仅仅是跟当下时刻输入信号的响应数值有关系,并且跟以往每个时刻输入信号的响应也都存在关联 ,它把对于过去所有输入所产生效果的累积都考虑在内了。在图像处理这个情况里,卷积处理之后得到的结果,实际上就是将每个像素周围的,甚至是整个图像范围之内的像素都纳入考量范围 ,以此来针对当前像素开展某种加权型的处理。因此可以这么讲,“积”属于全局范畴的概念,或者换种说法,它是一种“混合”行为,是针对两个函数,在时间层面或者空间层面上展开混合操作的行为。
2. 那么为何要展开“卷”?径直相乘难道就不好吗?照着我的理解来看,开展“卷”(也就是翻转)这一行为的目的实际上是去施加一种约束,这种约束明确规定了在进行“积”操作的时候要以什么作为参照依据。在信号分析的那种情形当中,它明确规定了是在哪个特定的时间点的前后去展开“积”的操作,而在空间分析的那种情形之下,它又明确规定了是在哪个位置的周边去开展累积处理的。
举例说明
下面举几个例子说明为什么要翻转,以及叠加求和的意义。
例1:信号分析
如图所示,输入信号为 f(t) ,其随时间变化 ,系统响应函数乃 g(t) ,图里此响应函数随时间呈指数下降 ,它的物理意义表明:要是在 t = 0 的时刻出现一个输入 ,那么随着时间的消逝 ,这个输入会持续衰减 ,也就是说 ,到了 t = T 时刻 ,原本在 t = 0 时刻的输入 f(0) 的值会衰减成为 f(0)g(T)。

鉴于信号是以连续方式进行输入的,这意味着,在每一个不同的时刻,都会存在新的信号不断地输入进来,所以,最终所输出的结果必然是所有在这之前已输入信号的叠加累积构成的效果图示。如下方图形展示所呈现的情况表明,就在T等于10这个时刻的时候,所产生的输出结果是跟图形当中带有标记的整片状区域具有关联关系。在具体的情况里,f(10)由于它是刚刚才输入进来的信号,所以它所产生的输出结果应当是f(10)g(0)这样一个结果,而对于时刻t等于9时输入的f(9)信号,它仅仅只经历了1个时间单位的衰减过程,所以由此产生的输出结果应该是f(9)g(1)这样的形式,按照这样的规律依次类推下去,也就是如同图形当中虚线所描述的那种相互之间的关系表现。这些相互对应的点,先进行相乘操作,之后再进行累加,所得到的结果,便是T = 10这个时刻的输出信号值。而这个得出的结果,同样也是f和g这两个函数,在T = 10时刻的卷积值。

显然,上面那种对应关系,看上去是比较难看的,呈现出拧着那样一种状态,所以呀,我们对着g函数进行对折这个操作,使其变成了g(-t),如此一来就会好看一些了。瞧见了没?这便是卷积之所以要“卷”,要进行翻转的缘由呀,这是从它自己所具有的物理意义当中得出的。

上图尽管没拧着,已然顺过来了,然而看上去仍有点错位,因而再进一步平移T个单位,便是下图。它乃是本文起始给出的卷积定义的一种图形的表述:

于是,于上述计算T时刻的卷积之际,所要维持的约束即为:t加上(T减去t)等于T。这般约束的意义,诸位便可自行体悟。
例2:丢骰子
于本问题,即那个如何通俗易懂地解释卷积的问题里,排名所处位列第一位置的,当中的马同学,在其中举出来了一个相当不错堪称很好的例子,下面的一些图是从马同学所写的文章处摘取得到的,在这儿要表达对此的感谢之意,他是用丢骰子这么个行为说明了卷积的应用情况。
正在面临需要去解决的问题是,那就是存在着两枚骰子,将这两枚骰子都进行抛出去这个动作,那么两枚骰子点数加起来成为4这种情况所具有的概率究竟是多少呢?

剖析一下,存在着这样的状况,即两枚骰子点数相加的结果为4,这种情况有三种,分别是:一种是1加上3等于4,还有一种是2加上2等于4,另外一种是3加上1等于4。
因此,两枚骰子点数加起来为4的概率为:
写成卷积的方式就是:
在这里我想进一步用上面的翻转滑动叠加的逻辑进行解释。
一开始,鉴于两个骰子的点数之和是4 ,为了达成这个约束状况,我们依旧将函数g进行翻转,接着把阴影区域上下相对应的数予以相乘,随后进行累加,这等同于求解自变量是4的卷积值,就如同以下图示这般:

更进一步,这般翻转之后,能够便利地开展推广,用以求取两个骰子点数之和为n时的概率,此概率为f与g的卷积f*g(n),情形如下方图示:。

能从在上的那个图看到,函数g的滑动,致使的是点数和的增大。在这个例子里,针对f和g的约束条件乃是点数和,它同样是卷积函数的自变量。要是有兴趣的话,还能够去算一算,倘若骰子各个点数出现的概率是均等的,那么当两个骰子的点数和n等于7的时候,概率是最大的。
例3:图像处理
仍然是选取知乎问题,怎样通俗易懂地去解释卷积当中,马同学所举的例子。图像能够呈现为矩阵形式(此图录取自马同学的文章):

针对图像开展的处理函数包括多种情况,像是进行平滑处理,又或者是开展边缘提取操作,这些处理函数能用一g矩阵予以表示,具体呈现形式如下:
注意,我们在处理平面空间的问题,已经是二维函数了,相当于:
那么函数f和g的在(u,v)处的卷积
该如何计算呢?
按卷积的定义,二维离散形式的卷积公式应该是:
卷积定义而言,是要在x方向与y方向去做累加,这对应上面离散公式里的i与j两个下标,并且该累加是无界的,范围自负无穷至正无穷。然而现实之中世界皆是具有界限限定的。像上面所列举的图像处理函数g实际上就是个3x3矩阵这种情况,这意味着在除了原点附近之外的部分,其余所有点的取值均设定为0。鉴于此一因素,上面的公式实际上出现了退化,它仅仅是把坐标(u,v)附件区域的那些点选取出来用以展开计算了。进而有如此实际发生之计算所呈现的情形如下:

首先我们在原始图像矩阵中取出(u,v)处的矩阵:
然后kiayun手机版登录入口,把图像处理矩阵开展翻转操作(此翻转颇具特点,能够存在几种不一样的理解方式,其最终实际效果是等同的:(1)率先沿着x轴进行翻转,紧接着沿着y轴开展翻转;(2)一开始沿x轴翻转,随后沿y轴翻转),情况如下:
原始矩阵:

翻转后的矩阵:
(1)先沿x轴翻转,再沿y轴翻转
(2)先沿y轴翻转,再沿x轴翻转
计算卷积时,就可以用
的内积:
请注意,上面的公式展现出一个特性,进行乘法运算的那两个对应的变量a与b,它们的下标之和俱为(u,v),其目标便是对于这般的加权求和予以一种限定。这也是把矩阵g予以翻转的缘由所在。上面矩阵的下标按照那般方式书写,并且实施了翻转,是为了能够让大家更为明晰地察觉到跟卷积的关联。这么做所具备的益处是便利进行推广,同时也有利于理解其物理意思。实际于计算之际,都运用翻转之后的矩阵,直接求取矩阵内积便行了。
所计算的是处于(u,v)位置处的卷积,沿着x轴或者y轴进行滑动,如此便能够求出图像里各个位置的卷积,其输出的结果是经过处理之后的图像,也就是那种达成了平滑、边缘提取等诸多处理的图像。
更进一步地去深入进行思考,当在计算图像卷积之际,我们是直接于原始图像矩阵当中选取了处于(u,v)这个位置的矩阵,为何要选取此位置的矩阵呢,实际上从本质上讲是为了去达成以上所提及的约束条件。因为我们要计算处于(u,v)处的卷积,并且g矩阵乃是3x3的矩阵,要使得下标与这个3x3矩阵相加后的结果是(u,v),那么就仅仅能够是选取原始图像里以(u,v)作为中心的这个3x3矩阵,也就是像图里面阴影区域所显示的那般是那种矩阵。
把事情进一步推广来说,要是g矩阵并非3x3,而是6x6,那么我们就得在原始图像里选取以(u,v)为中心的6x6矩阵来开展计算。照此来看,这样的卷积是将原始图像里相邻的像素都纳入考量范围,进而进行混合。其中,相邻的区域的范围是由g矩阵的维度所决定的,维度越大,所涉及的周边像素也就越多。并且,矩阵的设计对这种经由混合而后输出的图像与原始图像相比较而言,到底是变得模糊了,还是显得更锐利了,起到了决定性作用。
举例来讲,像下面的这种图像处理矩阵,会致使图像变得比较顺滑,看起来更加模糊,这是由于它把周边像素作了平均处置:
像这样的图像处理所需矩阵,会让那像素值改变显著之处变得更显眼,去强化边缘特征kiayun手机版登录下载,处于变化平缓区域的像素值则不受其影响,最终达成提取边缘这项目标,就是如此这般的情况。
对一些解释的不同意见
如同知乎问题卷积为何被称作「卷」积?里的荆哲来讲的,上面某些关于卷积所给出的、有的形象解释,以及问题怎样能够通俗易懂地对卷积作出解释?当中马同学等一些人所提出来给出下面这样比喻:


实际上,图里“卷”的那个方向,是顺着这个方向去做积分求和的方向,并没有那种翻转的意思。所以,这样的解释,并没有把卷积的含义完整地描述出来,对于“卷”的理解到底对不对值得去探讨一下。