【深度学习】深入浅出神经网络框架的模型元件（常用层和卷积层）_专栏

文章目录
1 常用层
    1.1 Dense
    1.2 Activation层
    1.3 Dropout
    1.4 Flatten
2 卷积层
    2.1 Cov2D
    2.2 Cropping2D层
    2.3 Cropping3D层
    2.4 ZeroPadding2D层

1 常用层

1.1 Dense

keras.layers.Dense(units, activation=None, use_bias=True, 
kernel_initializer='glorot_uniform', bias_initializer='zeros', 
kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None, 
kernel_constraint=None, bias_constraint=None)

Dense layer 就是常提到和用到的全连接层。Dense 实现的操作为：output = activation(dot(input, kernel) + bias) 其中 activation 是按逐个元素计算的激活函数，kernel 是由网络层创建的权值矩阵，以及 bias 是其创建的偏置向量 (只在 use_bias=True 时才有用)。

全连接层(Dense) 就是Linear层，即y= wx+b,计算乘法以及加法。由于矩阵乘法的特点，我们可以通过乘法操作，连接所有输入点以及输出点，因此也被称作全连接层。

1.2 Activation层

在这里插入图片描述
激活函数是什么？
激活函数，英文Activation Function，个人理解，激活函数是实现神经元的输入和输出之间非线性化。

以下通过“游乐场”里的例子看看线性函数的局限性。

对于明显的“一刀切”问题，线性函数还可以解决。

在这里插入图片描述
但是，对于要画曲线的问题就“无能为力”，但是现实世界中能简单“一刀切”的问题毕竟少，更广泛的是下图的非线性问题。

在这里插入图片描述
有哪些激活函数（activation function）
重点参考以下网站：https://blog.csdn.net/u011684265/article/details/78039280

ReLU
Tanh
Sigmoid

ReLU
Rectified Linear Unit(ReLU) - 用于隐层神经元输出

公式
在这里插入图片描述

sigmoid

sigmoid函数也叫 Logistic 函数，用于隐层神经元输出，取值范围为(0,1)，它可以将一个实数映射到(0,1)的区间，可以用来做二分类。
在特征相差比较复杂或是相差不是特别大时效果比较好。

sigmoid缺点：

激活函数计算量大，反向传播求误差梯度时，求导涉及除法

反向传播时，很容易就会出现梯度消失的情况，从而无法完成深层网络的训练

Sigmoids函数饱和且kill掉梯度。

Sigmoids函数收敛缓慢。

Tanh
公式
在这里插入图片描述

也称为双切正切函数，取值范围为[-1,1]。
tanh在特征相差明显时的效果会很好，在循环过程中会不断扩大特征效果。
与 sigmoid 的区别是，tanh 是 0 均值的，因此实际应用中 tanh 会比 sigmoid 更好

1.3 Dropout

解决过拟合
百分比(rate) 的输入神经元。正则化会给所有参数乘以一个系数，共同计算损失函数，为了避免损失函数过高，模型参数的数量、数值都会缩小。而这里使用Dropout随机断开连接，就等于是削减了参数的数量，这种方式可以用于防止过拟合。

在这里插入图片描述

1.4 Flatten

Flatten层用来将输入“压平”，即把多维的输入一维化，常用在从卷积层到全连接层的过渡。Flatten不影响batch的大小。

从vgg16网络中可以看出，但是在后来的网络中用GlobalAveragePooling2D代替了flatten层，可以从vgg16与inceptionV3网络对比看出。从参数的对比可以看出，显然这种改进大大的减少了参数的使用量，避免了过拟合现象。

        model.add(layers.MaxPooling2D(pool_size=(2, 2)))
        model.add(layers.Dropout(0.5))

        model.add(layers.Flatten())
        model.add(layers.Dense(512,kernel_regularizer=regularizers.l2(weight_decay)))
        model.add(layers.Activation('relu'))
        model.add(layers.BatchNormalization())

        model.add(layers.Dropout(0.5))
        model.add(layers.Dense(self.num_classes))
        # model.add(layers.Activation('softmax'))

2 卷积层

2.1 Cov2D

二维卷积可以处理二维数据

nn.Conv2d(self, in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True))
参数：
in_channel:　输入数据的通道数，例RGB图片通道数为3；
out_channel: 输出数据的通道数，这个根据模型调整；
kennel_size: 卷积核大小，可以是int，或tuple；kennel_size=2,意味着卷积大小(2,2)， kennel_size=（2,3），意味着卷积大小（2，3）即非正方形卷积
stride：步长，默认为1，与kennel_size类似，stride=2,意味着步长上下左右扫描皆为2， stride=（2,3），左右扫描步长为2，上下为3；
padding：　零填充
例子
输入数据X[10,16,30,32],其分别代表：10组数据，通道数为16，高度为30，宽为32

import torch
import torch.nn as nn

x = torch.randn(10, 16, 30, 32) # batch, channel , height , width
print(x.shape)
m = nn.Conv2d(16, 33, (3, 2), (2,1))  # in_channel, out_channel ,kennel_size,stride
print(m)
y = m(x)
print(y.shape)

维度转换很随意的，比如曾经用2dU-net网络训练三维医学图像哦，效果好极了，非常好，目前是我取得做好的结果。

2.2 Cropping2D层

keras.layers.convolutional.Cropping1D(cropping=(1, 1))

对2D输入（图像）进行裁剪，将在空域维度，即宽和高的方向上裁剪。

2.3 Cropping3D层

keras.layers.convolutional.Cropping3D(cropping=((1, 1), (1, 1), (1, 1)), data_format=None)

对2D输入（图像）进行裁剪。

2.4 ZeroPadding2D层

ZeroPadding2D，传入的参数如果是一个二维的tuple，((top_pad, bottom_pad), (left_pad, right_pad))，它表示在上下左右分别补多少层零。

from keras.layers import ZeroPadding2D, Input
from keras import Model
from numpy import *

image = array([[1, 2, 3],
               [4, 5, 6],
               [7, 8, 9]])
image = image.reshape((1, 3, 3, 1))
inputs = Input(shape=(3, 3, 1))
pad = ZeroPadding2D(((1, 0), (1, 0)))(inputs)
model = Model(inputs, pad)
out = model.predict(image)
print(reshape(out, (4, 4)))
>>>
[[0. 0. 0. 0.]
 [0. 1. 2. 3.]
 [0. 4. 5. 6.]
 [0. 7. 8. 9.]]

将参数改为((2, 0), (2, 0))，则

pad = ZeroPadding2D(((2, 0), (2, 0)))(inputs)
[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 1. 2. 3.]
 [0. 0. 4. 5. 6.]
 [0. 0. 7. 8. 9.]]

((1, 1), (1, 1))则在上下左右都补一层零

pad = ZeroPadding2D(((1, 1), (1, 1)))(inputs)
[[0. 0. 0. 0. 0.]
 [0. 1. 2. 3. 0.]
 [0. 4. 5. 6. 0.]
 [0. 7. 8. 9. 0.]
 [0. 0. 0. 0. 0.]]

在这里插入图片描述
下次还会更新一些其他的模型元件～

【深度学习】深入浅出神经网络框架的模型元件（常用层和卷积层）