卷积的层

回到术语表
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,通常用于识别图像中存在的模式,但它们也用于空间数据分析、计算机视觉、自然语言处理、信号处理和各种其他目的。卷积网络的架构类似于人类大脑中神经元的连接模式,受到视觉皮层组织的启发。这种特定类型的人工神经网络得名于网络中最重要的操作之一:卷积。

什么是卷积?

卷积是一个有序的过程,其中两个信息源交织在一起;它是一种把一个函数变成另一个函数的操作。卷积长期以来一直被用于图像处理,通常用于模糊和锐化图像,但也用于执行其他操作。(例如增强边缘和浮雕)cnn强制相邻层的神经元之间的局部连接模式。卷积神经网络cnn使用过滤器(也称为内核)来检测整个图像中存在哪些特征,例如边缘。CNN有四个主要操作:
  • 卷积
  • 非线性(ReLU)
  • 池化或子抽样
  • 分类(全连通层)
卷积神经网络的第一层总是a卷积的层。卷积层对输入应用卷积运算,将结果传递给下一层。卷积将其接受域内的所有像素转换为单个值。例如,如果你要对一张图像应用卷积,你将减小图像的大小,同时将字段中的所有信息整合到一个像素中。卷积层的最终输出是一个向量。根据我们需要解决的问题类型和我们想要学习的特征类型,我们可以使用不同类型的卷积。

2D卷积层

最常用的卷积类型是2D卷积层,通常缩写为conv2D。conv2D层中的过滤器或内核在2D输入数据上“滑动”,执行逐元素的乘法。结果,它将把结果汇总到单个输出像素中。内核将对它滑过的每个位置执行相同的操作,将二维特征矩阵转换为不同的二维特征矩阵。

扩张卷积或阿特劳斯卷积

该操作通过在卷积核中插入零值来扩展窗口大小,而不会增加权值的数量。膨胀卷积或阿特劳斯卷积可用于实时应用程序和处理能力较低的应用程序,因为RAM需求不太密集。

可分离旋转

可分离卷积主要有两种类型:空间可分离卷积和深度可分离卷积。空间可分离卷积主要处理图像和核的空间维度:宽度和高度。与空间可分离卷积相比,深度可分离卷积使用的内核不能被“分解”成两个更小的内核。因此,它被更频繁地使用。

转置运算

这些类型的卷积也被称为反卷积或分数步卷积。转置卷积层执行规则卷积,但还原其空间变换。

额外的资源


回到术语表