云手机网页版 一文搞懂卷积神经网络(CNN)的原理(超详细)

频道:生活应用 日期: 浏览:135

卷积神经网络,也就是Convolutional Neural Network,简称为CNN,是深度学习模型,此模型于计算机视觉领域收获巨大成功,其设计灵感源自生物学里的视觉系统kiayun手机版登录,目的在于模拟人类视觉处理方式,在过去数年间,CNN于图像识别、目标检测、图像生成以及诸多其他领域取得显著进展,成为计算机视觉跟深度学习研究的重要构成部分 。

一、图像原理

在了解卷积神经网络前,我们先来看看图像的原理:

在计算机里,图像是由一堆数字构成的,这些数字是按顺序排列的,其数值范围是从0到255,其中0代表着最暗的程度,而255则代表着最亮的程度,如下图所示 。

图像识别卷积操作_卷积在生活应用_卷积神经网络原理

在上图之中,存在着一种仅仅只有黑白两种颜色的灰度图,然而,更为普遍适用的那种图片表达方式,乃是RGB颜色模型,也就是,一种由红、绿、蓝这三种原色的色光,按照各不相同并存在差异的比例相互相加,进而才能够产生出各种各样、品类繁多的色光。在RGB颜色模型这个范畴之内,原本单一的一个矩阵,就扩展演变成了按照一定顺序进行排列的三个矩阵,当然了,其表达形式也能够运用三维张量,利用这种方式去加以理解 。

当中的每一道矩阵,又称作这幅图片的一个通道,由宽度、高度以及深度予以叙说。

图像识别卷积操作_卷积在生活应用_卷积神经网络原理

二、为什么要学习卷积神经网络?

于传统神经网络里,当我们需要去辨认下图被红色框住的图像的时候,我们极有可能没办法识别出来,缘由是这六张图所处位置全都不同,计算机没有办法分辨出它们实际上是同一种形状或者物体。

卷积神经网络原理_图像识别卷积操作_卷积在生活应用

传统神经网络原理如下图:

卷积神经网络原理_图像识别卷积操作_卷积在生活应用

我们期望,一个物体,不论处于画面左侧,还是处于画面右侧,皆会被识别成同一物体,而这一特征便是不变性。为达成平移不变性,诸如卷积神经网络(CNN)这类深度学习模型,于卷积层当中运用了卷积操作,此操作能够捕获图像里的局部特征,且不受其位置的干扰。

图像识别卷积操作_卷积在生活应用_卷积神经网络原理

三、什么是卷积?

于卷积神经网络里,卷积操作乃指把一个能够移动的小窗口,此小窗口称作数据窗口,如下面图示的绿色矩形模样,与图像开展逐元素相乘,之后加以相加的操作。这个小窗口实际上是一组固定的权重,它能够被视作是一个特定的滤波器,也就是filter,或者卷积核。这个操作的名称为卷积,它源于这种元素级相乘以及求和的过程。这一操作是卷积神经网络名字的由来。

图像识别卷积操作_卷积在生活应用_卷积神经网络原理

数据窗口就是上图中绿色的那个小窗。简单讲来呢,卷积操作其实就是拿一个可移动之小窗口,以此去提取图像里的诸多特征,该小窗口涵盖着一组特定的权重,借由同一个东西与图像的不同位置开展卷积操作这件事,网络能够做到去学习随后捕捉到不同特征的那种信息。文字相关解析或许太难让人弄明白,紧随其后直接呈上动图:

卷积在生活应用_卷积神经网络原理_图像识别卷积操作

在这张图里,有一个蓝色的框,它所指的是一个数据窗口,还有一个红色框,其为卷积核也就是滤波器,经过一系列运算后,最后得到的绿色方形代表的是卷积得到的结果,该结果是数据窗口中的数据与卷积核逐个元素相乘之后再进行求和所得来的 。

卷积神经网络原理_图像识别卷积操作_卷积在生活应用

一张图带你了解卷积计算过程

卷积需要注意哪些问题?

a.步长stride:每次滑动的位置步长。

b. 卷积核的数量,它决定了输出的深度厚度,并且这也同时代表着卷积核的个数 。

c. 填充值zero-padding:于外围边缘补充若干圈0,借此方便从初始位置以步长为单位能够刚好滑倒末尾位置,通俗来讲就是为了让总长可以被步长所整除。

以上图为例,那么:

数据窗口,每一次进行移动,是以两个步长为单位,去获取 3*3 的局部数据,步长的值是 2 。

• 两个神经元,即 depth=2 ,意味着有两个滤波器。

• zero-padding=1 。

为什么要进行数据填充:

假设有一个大小为 4x4 的输入图像:

此刻,我们需运用一个 3x3 的卷积核来开展卷积操作,步幅定格为 1,与此同时要采用填充为 1。要是不采用填充,那卷积核的中心便没有办法对齐到输入图像的边缘,进而致使输出特征图尺寸变小。假定我们是以步幅 1 来进行卷积,那样在不采用填充的情形下的话,此输出特征图的尺寸会是 2x2 。

于是乎,我们得于它的周边填布满一圈0,填成1所表达的意思便是于图像被输入时的周边增添一圈零之数值,增添完填充之后的图像:

0, 0, 0, 0, 0, 0

0, 1, 2, 3, 4, 0

0, 5, 6, 7, 8, 0

0, 9, 10, 11, 12, 0

0, 13, 14, 15, 16, 0

0, 0, 0, 0, 0, 0

当下,我们把 3x3 的卷积核运用到这个经过填充处理的输入图像之上,去计算卷积之后的结果,进而获取到尺寸保持不变的特征图。

卷积核要覆盖输入图边缘区是以数据填充为目的,与此同时输出特征图大小被保持,用于CNN保留空间信息并有效处理图像边缘信息,这十分重要的。

卷积神经网络的模型是什么样的?

卷积神经网络原理_图像识别卷积操作_卷积在生活应用

被上面红框框起来的那部分,能够作这样的理解,它是一个滤波器开·云体育app下载安装,也就是那群带有一组固定权重的神经元。多个滤波器叠放在一起,如此便形成了卷积层。

四、卷积神经网络的构造

卷积神经网络原理_图像识别卷积操作_卷积在生活应用

1 输入层

最先的输入层级会接纳那种原本的图像数据,图像一般是由三个颜色通道来构成的,分别是红色、绿色以及蓝颜色,进而形成一个二维状态的矩阵,这个矩阵用来表示像素的强度数值,。

2 卷积和激活

卷积层会于运用卷积核跟输入图像开展卷积运作,而后,借由应用诸如ReLU这般的激活函数去引入非线性,此步骤能让网络具备对复杂特征予以学习的能力。

3 池化层

池化层借助减小特征图的尺寸,以此来降低计算复杂性,它凭借选择池化窗口内的最大值或者平均值得以达成,这对提取最为重要的特征有所助力。

4 多层堆叠

美国有线电视新闻网一般为由好多卷积以及池化层的层层堆叠而构成,从而逐步去提取更高等级别的特征,深层次的特征能够展现更为复杂的模式 。

5 全连接和输出

随后,全连接层把所提取的特征映射转变为网络的最终.output。这个.output可能是一个进行分类举动的标签,也可能是一次回归操作所得的值,又或者是其他任务的.result 。

形象的过程如下图:

展开形式

卷积在生活应用_图像识别卷积操作_卷积神经网络原理

未展开形式

图像识别卷积操作_卷积神经网络原理_卷积在生活应用

五、图片经过卷积后的样子

与人眼观看事物原理相似kiayun手机版登录app游戏登录入口.手机端安装.cc,卷积神经网络可以看到事物的轮廓

图像识别卷积操作_卷积神经网络原理_卷积在生活应用

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。