针对移动端与嵌入式视觉应用的卷积神经网络MobileNet系列解析

如题所述

第1个回答  2022-07-07

MobileNet V1 (2017)

(1)MobileNets基于一种流线型结构使用深度可分离卷积来构造轻型权重深度神经网络,核心部件就是 深度可分离卷积

(2)MobileNet是一种基于深度可分离卷积的模型,深度可分离卷积是一种将标准卷积分解成深度卷积以及一个1x1的卷积即逐点卷积

(3)深度卷积针对每个单个输入通道应用单个滤波器进行滤波,然后逐点卷积应用1x1的卷积操作来结合所有深度卷积得到的输出

(4)对深度卷积,它的卷积核厚度不是输入张量的通道数,而是1,输出通道就是卷积核数目。经典卷积的卷积核厚度默认是图片的通道数

(5)可分离卷积tf内置函数: tf.layers.separable_conv2d

公式计算:

MobileNet V2 (2018)

(1)Mobilenet V2实在Mobilenet V1的基础上发展而来,V2 主要引入了两个改动:Linear Bottleneck 和 Inverted Residual Blocks。两个改动分别对应V1和Resnet

(2)MobileNetV1遗留的问题

(3) 对比 MobileNet V1 与 V2 的微结构

(4) 对比 ResNet 与 MobileNet V2 的微结构

MobileNet V3 (2019)

论文地址:https://arxiv.org/pdf/1905.02244.pdf

(1)具体的内容可以看论文,这里我只是重点说明其中的激活函数改进(swish/h-swish)和网络结构改进(bneck)

(2)激活函数:作者发现一种新出的激活函数swish x 能有效改进网络精度

但就是计算量太大了,于是作者对这个函数进行了数值近似:

近似结果:

(3)网络结构:在大体思路上引用mobilenet v2的结构pw-dw-pw,其中激活函数添加了h-swish,同时在v2基础上添加了Squeeze excitation layer,具体的设置可查阅论文中的网络参数图对照,

其中Squeeze excitation layer

Squeeze excitation layer是引入基于squeeze and excitation结构的轻量级注意力模型SENet

论文:《Squeeze-and-Excitation Networks》

论文链接:https://arxiv.org/abs/1709.01507

相似回答
大家正在搜