卷积神经网络 Convolutional Neural Networks
:material-circle-edit-outline: 约 458 个字 :material-clock-time-two-outline: 预计阅读时间 2 分钟
CNN是全连接神经网络的一种简化版本,专门用于处理图像,图像有三大特点:
- 图像存在若干模式,其小于图像本身
- 模式可能出现在图像的多个位置
- 图像缩小不会导致模式变化
卷积操作
我们可以将一个矩阵转化为一个二维离散函数
卷积是指两个函数逐位相乘再相加,具体操作时我们会有一个图像矩阵,一些过滤小矩阵(卷积核),然后用小矩阵的中心对齐图像矩阵的每一个元素进行卷积操作,得到新的矩阵元素
过滤小矩阵代表的是一种模式,如果原矩阵一块地方符合这种模式,那么卷积出来的值就会很大,相当于匹配了这种模式。
说白了就是找原矩阵有没有符合本模式的地方,强度是多少,遍历并得到输出的过程即一个卷积操作
最大化池
我们将图像适当地等比减小并不会丢失关键特征,但可以减少计算量
每一个卷积核对原图像进行卷积操作后都会得到一个 feature map,我们将其分块,保留其最大值,删除其余元素,再拼回来,如此就删除了大部分无用信息,保留了最显著的信息,压缩了计算量
最大化池会导致位置信息丢失,导致严重错误
经典结构
经过多轮卷积和最大化池操作,然后拉直交给全连接层进行分类
ResNet
残差神经网络,用于解决深层网络训练困难、梯度消失/爆炸的问题