Skip to content

卷积神经网络 Convolutional Neural Networks

:material-circle-edit-outline: 约 458 个字 :material-clock-time-two-outline: 预计阅读时间 2 分钟

CNN是全连接神经网络的一种简化版本,专门用于处理图像,图像有三大特点:

  1. 图像存在若干模式,其小于图像本身
  2. 模式可能出现在图像的多个位置
  3. 图像缩小不会导致模式变化

卷积操作

我们可以将一个矩阵转化为一个二维离散函数

卷积是指两个函数逐位相乘再相加,具体操作时我们会有一个图像矩阵,一些过滤小矩阵(卷积核),然后用小矩阵的中心对齐图像矩阵的每一个元素进行卷积操作,得到新的矩阵元素

过滤小矩阵代表的是一种模式,如果原矩阵一块地方符合这种模式,那么卷积出来的值就会很大,相当于匹配了这种模式。

image-20250430110011272

说白了就是找原矩阵有没有符合本模式的地方,强度是多少,遍历并得到输出的过程即一个卷积操作

最大化池

我们将图像适当地等比减小并不会丢失关键特征,但可以减少计算量

每一个卷积核对原图像进行卷积操作后都会得到一个 feature map,我们将其分块,保留其最大值,删除其余元素,再拼回来,如此就删除了大部分无用信息,保留了最显著的信息,压缩了计算量

最大化池会导致位置信息丢失,导致严重错误

经典结构

经过多轮卷积和最大化池操作,然后拉直交给全连接层进行分类

image-20250430112316249

ResNet

残差神经网络,用于解决深层网络训练困难、梯度消失/爆炸的问题

image-20250430115603361