卷积&卷积神经网络
文章目录
1。关于卷积的直觉感觉
卷积定理:功能卷积的傅立叶变换等于功能傅立叶变换的乘积
时间域中的卷积等于频域的乘积
卷积的数学形式:
体积:f(t)g(t -t)f(t)g(tt)g(t -t)g(t -t)
产品:∫\int∫
实际上,卷积不会对G函数执行折叠转换。
卷积本质上是一个操作。操作员是 *。与乘法操作不同,它比常见的添加,减法,乘法和除法要高得多。卷积以简约的数学形式很好地描述了一个动态过程。
动态过程:一个动态过程,其中一个函数钻入另一个函数,而两个函数的重叠区域在一定程度上描述了卷积的结果。
2。在不同领域的卷积应用
iii。卷积神经网络(CNN)的诞生
法国学者Yann Lecun与神经网络合并了卷积操作,以提出著名的卷积神经网络。
随着21世纪大规模互联网大数据和GPU的迅速发展,自2012年以来,深层卷积神经网络已引起轰动,在过去十年中,人工智能技术的复兴,并在许多领域都表现出强大的能力。
卷积神经网络首先在计算机视觉领域使用。面部识别,数字识别和摄像头美女,其背后的算法的核心是CNN技术。
卷积神经网络必须对图像进行一轮卷积操作,然后再将其移交给神经网络。
图像信息可以转换为数字矩阵
要提取图像的特征,我们构建了一个方形矩阵(卷积内核)。
将卷积内核切割到原始图像上,将网格中的数字乘以,然后将它们添加到新图像矩阵上的相应位置(卷积内核的中心位置)上。此过程以数学公式表示,这是二维离散卷积操作
但是,如果这样做,则不能在原始图像的边缘穿越像素点,并且每次生成新矩阵时都必须缩短像素。因此,在卷积操作之前,将在原始图像的边缘添加一个0的圆,以确保输入和输出尺寸的一致性。
卷积操作是将输入乘以系统功能并计算输出。
在图像处理中,输入是原始图像的像素,系统函数是卷积内核。
卷积操作的重要性:不同的卷积内核将滤除不同的图像,并可以提取图像的不同特征。因此,这里的卷积内核也称为过滤器。
卷积不仅可以用于处理二维图像开yun体育app官网网页登录入口,还可以用于一维音频信号和自然语言。但是这里使用的卷积内核是1*n的一维卷积内核
4。卷积神经网络(CNN)
神经网络:CNN,RNN,LSTM,RBM
如果神经网络是黑匣子,并且数据被食用并吐出,那么不同神经网络之间的最大区别是腹部的网络结构。卷积神经网络的出色优势是什么?
(1)为什么需要卷积层
卷积神经网络(CNN)的结构
卷积神经网络模型:
传统意义上的神经元:
节点代表神经元,连接代表计算关系,每行都有一个权重。所谓的学习或培训是输入大量数据并调整培训期间的重量。
从传统意义上讲,节点的每个层都连接到上一层中的所有节点,从而形成了所谓的完全连接的网络。它看起来很密kaiyun全站网页版登录,但是非常多余。该模型相对笨拙,吃了很多东西,但没有显着影响。学术的观点是,有很多参数,很难训练。
卷积操作恰恰相反。可以描述一个简洁明了的公式,因此科学家提出了使用卷积减肥到神经网络的想法。
以二维图像为例,3*3卷积内核可以在特征提取中发挥重要作用。通过二维离散卷积操作,完整的连接变成了小的本地连接,从而实现了有效的图像特征提取。这些小型卷积内核具有传奇的空间翻译不变特征。
对于照片,无论您的脸在哪里,她都可以找到它。无论图像大小如何,每个滑动区域都具有相同的共享重量。如果使用3*3尺寸卷积内核,则只需要学习9个参数(忽略偏见)。
通过卷积操作获得的结果通常称为:特征图。特征图中的每个点由上一层中的几个点确定。如果使用3*3卷积内核,则每个点在上一层中由9个点确定,我们将这9点称为该点的接受场。
深卷积神经网络:卷积层越多,每个点的接受场就越大,表达复杂特征的能力越强。
以图像分类为例,在多层卷积神经网络中,第一层可以指示边缘是否以特定角度和位置出现。第二层可以将这些边缘组合为有趣的模式,例如模式。在第三层中,也许上一层上的模式可以进一步结合到对象特征部分的模式中。如果您继续逐步表达它,则可以学习图像的各种功能。
神经网络能够解决非线性问题的原因本质上是由于激活函数的非线性因素。
解决非线性问题的卷积神经网络的本质是添加线性整流器单元。
将特征映射上的所有负数转换为0,并且正数保持不变:替换所有特征毫无意义,并保留具有更大意义的特征。
(2)什么是合并层
合并意味着淤积和收敛。
掌握主要矛盾并忽略次要因素。池层将局部多个神经元的输出结合到单个神经元的较低层以减少数据维度(在小矩阵中找到最大值[最大值[最大值]或平均值[平均池])。对于本地合并,您通常可以选择2*2卷积内核。目的是进一步扩大主要特征,而忽略几个像素的偏差。它的意义不仅可以降低数据的维度并减少训练参数,还可以避免过度拟合。
(3)通话完整连接层
完全连接的层穿过相邻两个层的所有神经元,这与传统的神经网络实践相同。它的功能就像是从本地的角度得出的最终结论,并且与先前的卷积层一起,它形成了一种学习结构,该结构首先在本地,然后是整体上:卷积 +池,多层组合连接kaiyun全站登录网页入口,多规模特征提取和对输入数据的深度学习。
扁平:将结果矩阵拼接到行矢量中(125)
(4)为什么卷积神经网络如此强大
卷积神经网络变得更广泛,更深,更复杂。应用程序还迅速从最初的计算机愿景扩展到语音识别和自然语言处理等领域,并已应用于工程科学的各个行业。但是,无论它如何变化,CNN的核心思想都没有改变:使用卷积内核的特征提取能力,可以通过多级级联来实现多级特征学习。
(5)CNN的未来改进方向是什么
传统的CNN对输入形式,卷积内核,级联和初始化方法没有严格的要求,并且在这些方面有很大的改进空间。
然后将分段的超级像素作为新网络输入。
从视频信息中汇编:B台所有者Gengzhi兄弟
【卷积】一个视觉示例,在10分钟内彻底理解
【卷积神经网络】在8分钟内了解CNN,请阅读并查看动画说明