卷积神经网络中十大令人拍案叫绝的操作-伙伴云

网友投稿 1242 2022-05-29

来源 | 知乎

https://zhuanlan.zhihu.com/p/28749411

CNN从2012年的AlexNet发展至今，科学家们发明出各种各样的CNN模型，一个比一个深，一个比一个准确，一个比一个轻量。下面会对近几年一些具有变革性的工作进行简单盘点，从这些充满革新性的工作中探讨日后的CNN变革方向。

一、卷积只能在同一组进行吗？-- Group convolution

Alexnet

分组卷积的思想影响比较深远，当前一些轻量级的SOTA（State Of The Art）网络，都用到了分组卷积的操作，以节省计算量。但题主有个疑问是，如果分组卷积是分在不同GPU上的话，每个GPU的计算量就降低到 1/groups，但如果依然在同一个GPU上计算，最终整体的计算量是否不变？找了pytorch上有关组卷积操作的介绍，望读者解答我的疑问。

关于这个问题，知乎用户朋友 @蔡冠羽提出了他的见解：

https://www.zhihu.com/people/cai-guan-yu-62/activities

我感觉group conv本身应该就大大减少了参数，比如当input channel为256，output channel也为256，kernel size为3*3，不做group conv参数为256*3*3*256，若group为8，每个group的input channel和output channel均为32，参数为8*32*3*3*32，是原来的八分之一。这是我的理解。

我的理解是分组卷积最后每一组输出的feature maps应该是以concatenate的方式组合，而不是element-wise add，所以每组输出的channel是 input channels / #groups，这样参数量就大大减少了。

二、卷积核一定越大越好？-- 3×3卷积核

AlexNet中用到了一些非常大的卷积核，比如11×11、5×5卷积核，之前人们的观念是，卷积核越大，receptive field（感受野）越大，看到的图片信息越多，因此获得的特征越好。虽说如此，但是大的卷积核会导致计算量的暴增，不利于模型深度的增加，计算性能也会降低。于是在VGG（最早使用）、Inception网络中，利用2个3×3卷积核的组合比1个5×5卷积核的效果更佳，同时参数量（3×3×2+1 VS 5×5×1+1）被降低，因此后来3×3卷积核被广泛应用在各种模型中。

三、每层卷积只能用一种尺寸的卷积核？-- Inception结构

传统的层叠式网络，基本上都是一个个卷积层的堆叠，每层只用一个尺寸的卷积核，例如VGG结构中使用了大量的3×3卷积层。事实上，同一层feature map可以分别使用多个不同尺寸的卷积核，以获得不同尺度的特征，再把这些特征结合起来，得到的特征往往比使用单一卷积核的要好，谷歌的GoogleNet，或者说Inception系列的网络，就使用了多个卷积核的结构：

最初版本的Inception结构

卷积神经网络中十大令人拍案叫绝的操作

如上图所示，一个输入的feature map分别同时经过1×1、3×3、5×5的卷积核的处理，得出的特征再组合起来，获得更佳的特征。但这个结构会存在一个严重的问题：参数量比单个卷积核要多很多，如此庞大的计算量会使得模型效率低下。这就引出了一个新的结构。

四、怎样才能减少卷积层参数量？-- Bottleneck

发明GoogleNet的团队发现，如果仅仅引入多个尺寸的卷积核，会带来大量的额外的参数，受到Network In Network中1×1卷积核的启发，为了解决这个问题，他们往Inception结构中加入了一些1×1的卷积核，如图所示：

加入1×1卷积核的Inception结构

根据上图，我们来做个对比计算，假设输入feature map的维度为256维，要求输出维度也是256维。有以下两种操作：

五、越深的网络就越难训练吗？-- Resnet残差网络

ResNet skip connection

六、卷积操作时必须同时考虑通道和区域吗？-- DepthWise操作

七、分组卷积能否对通道进行随机分组？-- ShuffleNet

八、通道间的特征都是平等的吗？-- SEnet

九、能否让固定大小的卷积核看到更大范围的区域？-- Dilated convolution

十、卷积核形状一定是矩形吗？-- Deformable convolution 可变形卷积核

启发与思考

卷积核方面：

大卷积核用多个小卷积核代替；

单一尺寸卷积核用多尺寸卷积核代替；

固定形状卷积核趋于使用可变形卷积核；

使用1×1卷积核（bottleneck结构）。

卷积层通道方面：

标准卷积用depthwise卷积代替；

使用分组卷积；

分组卷积前使用channel shuffle；

通道加权计算。

使用skip connection，让模型更深；

densely connection，使每一层都融合上其它层的特征输出（DenseNet）

人工智能

为 AI 从业者/研究生/研究员专门定制的全网唯一高端 AI 训练营

1242 2022-05-29

深度学习的故障诊断算法">深度残差收缩网络：一种深度学习的故障诊断算法

1242 2022-05-29

Mindspore 1.0初体验

1242 2022-05-29

卷积神经网络中十大 令人 拍案叫绝的操作

为 AI 从业者/研究生/研究员专门定制的全网唯一高端 AI 训练营

深度学习的故障诊断算法">深度残差收缩网络：一种深度学习的故障诊断算法

Mindspore 1.0初体验

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接

卷积神经网络中十大令人拍案叫绝的操作

微信扫一扫：分享

深度学习的故障诊断算法">深度残差收缩网络：一种深度学习的故障诊断算法

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

Excel项目进度表模板，简化您的项目进度管理">Excel项目进度表模板，简化您的项目进度管理

友情链接