视觉-卷积层基础知识

如题所述

第1个回答 2022-06-25

1. 卷积层的组成和每层的作用

卷积神经网络（CNN）主要由卷积层、激活函数、池化层、全连接层组成。

卷积层（Conv）：使用卷积核进行特征提取和特征映射

激活函数（Activation）：由于卷积也是一种线性运算，因此需要增加非线性映射

池化层（Pool）：对输入的特征图进行压缩，一方面使特征图变小，简化网络计算复杂度；一方面进行特征压缩，提取主要特征

全连接层（FC）：连接所有的特征，将输出值送给分类器

2. 为什么使用卷积核：

1x1卷积的主要目的是为了减少维度，还用于修正线性激活（ReLU）。

加深了网络的层次，同时也增强了网络的非线性。

3. Max Pooling vs. Average Pooling

通常来讲，max-pooling的效果更好，虽然max-pooling和average-pooling都对数据做了下采样，但是max-pooling感觉更像是做了特征选择，选出了分类辨识度更好的特征，提供了非线性。 pooling的主要作用一方面是去掉冗余信息，一方面要保留feature map的特征信息，在分类问题中，我们需要知道的是这张图像有什么object，而不大关心这个object位置在哪，在这种情况下显然max pooling比average pooling更合适。在网络比较深的地方，特征已经稀疏了，从一块区域里选出最大的，比起这片区域的平均值来，更能把稀疏的特征传递下去。

average-pooling更强调对整体特征信息进行一层下采样，在减少参数维度的贡献上更大一点，更多的体现在信息的完整传递这个维度上，在一个很大很有代表性的模型中，比如说DenseNet中的模块之间的连接大多采用average-pooling，在减少维度的同时，更有利信息传递到下一个模块进行特征提取。average-pooling在全局平均池化操作中应用也比较广，在ResNet和Inception结构中最后一层都使用了平均池化。有的时候在模型接近分类器的末端使用全局平均池化还可以代替Flatten操作，使输入数据变成一位向量。

4. 为什么要使用许多小卷积核(如3x 3 )而不是几个大卷积核？

这在VGGNet的原始论文中得到了很好的解释。原因有二：首先，您可以使用几个较小的核而不是几个较大的核来获得相同的感受野并捕获更多的空间上下文，但是使用较小的内核时，您使用的参数和计算量较少。其次，因为使用更小的核，您将使用更多的滤波器，您将能够使用更多的激活函数，从而使您的CNN学习到更具区分性的映射函数。

5. 什么是数据正则化/归一化(normalization)？为什么我们需要它？

数据归一化是非常重要的预处理步骤，用于重新缩放输入的数值以适应特定的范围，从而确保在反向传播期间更好地收敛。一般来说采取的方法都是减去每个数据点的平均值并除以其标准偏差。如果我们不这样做，那么一些特征(那些具有高幅值的特征)将在cost函数中得到更大的加权(如果较高幅值的特征改变1 %，则该改变相当大，但是对于较小的特征，该改变相当小)。数据归一化使所有特征的权重相等。

相似回答

视觉-卷积层基础知识答：如果我们设计了6个卷积核，可以理解：我们认为这个图像上有6种底层纹理模式，也就是我们用6中基础模式就能描绘出一副图像。卷积层的作用是提取一个局部区域的特征。卷积神经网络（ConvolutionalNeuralNetwork，CNN或ConvNet）是一种具有局部连接、权重共享等特性的深层前馈神经网络。卷积神经网络是受生物学上感...

【高层视觉】透析卷积神经网络(CNN)中的卷积核概念和原理答：自动学习的神韵: 在CNN的世界里，卷积核不再仅仅是固定参数，而是能够自我学习的智能元素。它们无需繁琐的人工特征工程，就能自动发掘图像中的潜在特征，极大地提升了处理效率和准确性。多维度的探索: 从基础的特征提取到高级概念的深化，如池化层的作用，这些都构成了CNN的基石。深入理解卷积，就像揭开傅...

CNN 系列 (一) 详解 卷积层 和池化层答：卷积层与滑动窗口的深度解析：</CNN能够处理多维度样本，其基础是卷积和池化操作，它们以滑动窗口的形式在数据上进行。滑动窗口在众多领域广泛应用，CNN中的卷积窗口则有二维和一维之分。理解一维滑动窗口尤为关键，例如，PyTorch为我们提供了针对不同维度的卷积函数。一维滑动窗口如同一个指针，从向量首端开...

一文看懂卷积神经网络-CNN(基本原理+独特价值+实际应用)答：CNN 的基本原理: 卷积层 – 主要作用是保留图片的特征池化层 – 主要作用是把数据降维,可以有效的避免过拟合全连接层 – 根据不同任务输出我们想要的结果 CNN 的实际应用: 图片分类、检索目标定位检测目标分割人脸识别骨骼识别本文首发在 easyAI - 人工智能知识库《一文看懂卷积神经网络-CNN(基本原...

卷积神经网络(CNN)——图像卷积答：卷积层：智能结构探索卷积层通过互相关运算，像一个移动的“窗口”在输入张量上滑动，与核张量进行深度交互。这一过程不仅能减小输出尺寸，如3x3输入与2x2核结合，会得到(Nh-2+1)×(Nw-2+1)的输出，更重要的是，它能捕获图像中的局部结构信息，为后续分析提供基础。二维视角下的应用二维卷积层展示了...

计算机是如何理解图片的?——基于深度学习的计算机视觉与卷积神经...答：深入理解计算机视觉的基础，包括优化的损失函数、激活函数，以及参数初始化等关键步骤，是实现高效学习的基础。此外，回顾一系列CV知识点，如卷积与池化的运作原理，将帮助我们更好地掌握这一技术。在最新论文方面，CVPR Oral中，谷歌和斯坦福大学的李飞飞团队推出TIRG（Text-Image Retrieval with Grounding），...

大家正在搜

第二层卷积层卷积层和池化层的区别全卷积层卷积层是什么卷积层深度怎样算一个卷积层卷积层功能卷积层的选取线性卷积层