深度学习框架(深度学习的通道到底是什么?有什么用?(小白可看))
目录
1.什么是通道?
1.输入通道数等于卷积核通道个数
2.卷积核个数 等于 输出通道个数
2.为什么要增加通道
3.补充
1.什么是通道?
通道在我看来可以简单理解为图像的深度 。通过阅读一些帖子 ,我觉得有两个总结对理解通道很有帮助 ,这里在下面介绍一下 。
计算机在存储图片时是以数字矩阵的形式存储,例如我们最常见的彩色图片 ,RNG格式 ,它包含红 ,黄 ,蓝三个通道 ,而灰色图片只有一个通道。
1.输入通道数等于卷积核通道个数
例如当我们输入的图片为三通道时 ,那么卷积核也会有三个通道 ,就像上述图片 ,最左边的三个矩阵是一个图片的三个通道(因为计算机上是以数字矩阵存储) ,与这张图片相乘的是一个1*1的三通道卷积核 。
为了让图像的三个通道和卷积核分别进行点积并相加得到一个矩阵,即一个特征图 ,所以卷积核的通道也要有三个 ,为了和图像的每个通道都进行运算 。
2.卷积核个数 等于 输出通道个数
卷积核的数量决定输出的通道数,比如说现在有一张像素为16*16的三通道图片(16*16*3) ,其实这张照片就由三个16*16的矩阵组成 ,如果这时我们有256个3*3*3的卷积核,其实就是每个卷积核由3个3*3的矩阵 ,有256个这样的卷积核 。那么这张16*16*3的图片要和256个3*3*3的卷积核都进行点积并相加得出特征图 ,即得到的特征图有256个 ,即卷积核的个数 ,也是输出通道的个数 。
2.为什么要增加通道
在一张照片中可能有很多信息 ,比如人 ,动物.... ,我们人眼可以一下子就分辨出来 ,但是计算机不可以 ,他要进行特征提取,也是卷积的第一个操作 。
我们增加通道数就代表着增加特征 ,而造成通道数增加的操作其实就是卷积核的增加 ,不同的卷积核可以提取到不同特征,比如说平滑卷积核 ,它可以让整个图像更加平滑清晰 ,还比如增加水平边界过滤器,垂直边界过滤器(本质都是卷积核) ,让图像的矩阵和卷积核进行点积相加 ,得到不同的矩阵 ,即不同的特征图 ,这些特征图越多 ,越利于计算机学习 ,这将教会计算机识别特征 。
因为不同的卷积核可以分辨出不同的特征 ,所以增加卷积核的个数很必要 ,计算机通过利用这些特征图 ,来最终得到结论,分辨出图像的事物到底是什么 。
3.补充
池化操作是为了在降低像素的同时保存重要信息 ,而降低像素也十分必要 ,要通过降低像素来减少计算机的内存消耗 。
网络中常常增加通道同时降低像素,但如果不断降低像素而不增加通道 ,那么图片通过激活函数等操作后很可能会遗漏重要信息 ,那么这个网络的训练效果可能就会不理想 。
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!