10卷积神经网络（初级）

发表于2025-11-12|更新于2025-11-12|pytorch刘二大人

|浏览量:

二维卷积神经网络

放进卷积层，然后使通道数提升

下采样层中通道数是不变的但是宽高会变

目的减少数据量，降低运算的需求 00:05:59.344

再做一次5x5的卷积然后2x2的下采样

最后要把三阶向量展开成一维向量就是挨个排序 00:07:13.014

然后利用全连接层来映射到10个输出

利用各种层，进行维度变换

卷积+下采样=特征提取器

图像： rgb图像栅格图像 00:11:25.291

00:25:19.212 取出来一个图形块对图像块进行卷积依次移动

输出通道数 00:28:20.851 00:29:22.737

这个就是单通道卷积的形象表示

三通道卷积 00:31:02.697

每一个通道设置一个卷积核 00:32:17.903

最后三维变成1维 00:33:10.285

由于kernel 是3x3的所以 h和w减二

n个通道，就需要n个卷积核 00:39:22.814

00:39:58.292 00:40:29.340

00:40:45.478 输入输出通道，所有输入的数据都应是小批量的生成随机输入数据 conv_layer卷积层输入通道数量输出通道数量 kernel大小

把创建的对象输入到卷积层中

输入5各通道 100X100长宽输出10个通道 10 ，98，98

10是输出通道数5输入通道，3，3是卷积核大小

如果我们想要获得5X5的图像，而不是卷积过后3x3的

我们可以在input外围添加一圈 00:46:00.422 7x7 * 5x5 -> 5x5

最常见的就是填充0

这里的B是batch——size

构建一个卷积层前两个变量，一个是输入通道，一个是输出通道数 pading 就是上图填0

构建卷积核 00:48:57.849

输出、输入、宽度、高度

这里对卷积层进行了初始化

如果要输出2x2的这里就要求stride这个参数为2，也就是步长为2，一次移动两格（长宽都一样 00:49:51.532 00:50:04.802 这个可以有效降低输出的宽高 00:50:33.270

代码变动在这里

下采样

最大池化层

分成2x2的区间，然后再这个各格子内，找最大值

与通道无关，所以变换过后，通道数不变 00:51:51.468

笨比了

5x5的kernel会导致图像长宽变小4 这个可以自己画个图理解一下

00:53:18.662 进行一个最大池化 00:53:41.142 输入通道和输出通道00:54:00.492

320个元素进行向量化，经过全连接层，映射成10 00:56:19.190

下面将全连接的网络改成卷积神经网络 00:56:46.689 00:57:02.712

relu是进行激活 00:57:43.856

00:58:42.200 右边代码和左图有点不一样右边代码是是做完卷积之后先做的池化，然后做的激活 00:59:43.641

view目的就是让其映射到全连接网络所需要的输入 fc就是使用全连接层进行变换

由于要进行交叉熵损失计算，所以最后一层不需要进行激活

文章作者: Xing

文章链接: http://example.com/2025/11/12/pytorch%E5%88%98%E4%BA%8C%E5%A4%A7%E4%BA%BA/10%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C%EF%BC%88%E5%88%9D%E7%BA%A7%EF%BC%89/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Xing！

神经网络卷积神经网络计算机网络深度学习 PyTorch 刘二大人机器学习 CNN 网络

相关推荐

11卷积神经网络（高级）

之前学习的都是线性的串行结构就是上一个的输出作为下个的输入 00:02:06.381 convoltion：卷积 pooling：池化 softmax：输出 other：拼接层为了减少代码冗余： - 使用函数调用 - 构造类 00:04:05.180 发现这些快长得都一样所以把其封装成类 00:06:02.235 有一些参数比较难选比如kernel选哪个， googlenet的思路是，再一个块中，使用多个kernnel 然后对结果进行评价，让最优的kernel权重增加 00:09:21.370 对于每一条路，变换之后bwh必须相同 c可以不同 00:11:39.744 00:11:51.236 00:11:59.066 00:13:31.719 00:13:30.545 00:13:30.545 求和也就是信息融合 00:17:39.604 00:19:24.494 上面这个的运算量太大了 00:20:06.613 直接变为原来的十分之一这个也就是1x1的卷积神经网络的作用网络中的网络：1x1卷积 00:...

目标实现一个学习系统理解简单的神经网络（nn）/dl 00:11:46.636 人类智能 1. 通过信息进行推理 2. 看到照片与抽象概念结合：预测 00:19:29.936 mechine learning 就是代替人脑目前常用的都是监督学习算法思维： - 穷举 - 贪心 - 分治 - 动态规划深度学习：有数据集找出算法机器学习计算过程也就是函数来源于数据，而不是人工（基于统计） 00:24:01.499 dl属于表示学习rl 00:28:28.199 求原函数首先构造知识库 00:29:14.598 00:29:41.156 实现类似人类智能的就算ai 00:32:34.716 对于复杂问题，基于规则的代码，人类难以维护经典机器学习：手工提取特征。最重要要把 00:34:05.608 重点是使用机器学习找到中间的f(x) 00:34:40.521 表示学习还要通过学习获得特征维度诅咒 00:36:43.485 特征2维就需要102 如果是3维就103 00:39:08.956 10维空间映射到3维 0...

4back propagation(反向传播）

00:01:49.339 00:02:18.624 注意这里时对损失进行求导，而不是对ŷ 00:02:33.467 00:03:04.905 image.png 第一层00:03:49.205 隐层h1第一层，是6维的 x是5维的隐层h2 7维写解析式太麻烦了面对这样的复杂网络把网络看成图再图上进行传播梯度基于链式法则 00:05:33.953 两层神经网络 00:06:52.853 这个转置符号无所谓 x的维数为N 00:07:26.884 00:08:01.980 00:08:29.528 h1的维数为m b1是m维 00:08:58.784 00:09:27.210 全链接神经网络的第一层下面是第二层 00:09:52.605 00:11:58.074 把两层变成1层，不管多少层，线性变换，都可以变成1层。为了提高模型的复杂程度 00:12:34.502 添加一个非线性的函数，用于提高复杂程度 nonliner 00:13:14.804 00:13:55.471 链式求导法则...

深度学习顺序 1. 准备数据集 2. 模型选择 3. 训练 4. 推理 00:01:57.536 00:02:38.739 00:03:56.345 仅有输入的数据，在测试或者推理阶段 00:04:40.157 数据集交给算法，得到预测算法，使用模型只进行预测 00:05:46.753 知道输出值-》监督学习测试集用于评价模型好坏数据集分成两个部分 00:08:42.608 00:10:06.592 00:12:21.957 00:13:54.806 深度学习训练最大问题：过拟合过拟合：把图像中的噪声也学进去了比如训练集中的小猫都很可爱，但是测试集的小猫不可爱，导致测试中无法准确识别需要模型有比较好的泛化能力训练集分成两份开发集用于对训练集进行评估，防止过拟合评估比较好好再把所有的训练集重新训练，之后丢给测试集 00:15:00.775 00:17:13.524 其实就是找到f(x) 线性模型是最基本的，可以最开始测试是否可用预测出来的加上y heater 00:20:28.689 如何找到斜率为2 ...

3梯度下降算法的实现

00:02:00.228 使用随机猜测寻找ŷ − y 最小值 00:03:10.941 00:03:41.947 两个权重w1 w2 00:04:06.938 这个搜索量太大了穷举法搜不过来搜索区间过大导致问题 ==分治思想== 00:05:02.292 00:05:11.770 对于两个权重，进行划分，只考虑这点00:06:02.911 image.png 使用这几个点代表所有的空间 00:07:07.962 00:07:29.136 分治思想的缺点，会有如上的情况，导致无法获取最低点。有可能会错过比较好的低点 00:09:26.071 要求函数的最小值 00:10:16.901 00:10:41.308 00:11:34.211利用梯度来判断这个点需要进行的平移方向，也就是如果梯度导数 > 0 ,也就是这个点右移会上升所以应该选择导数的负方向（下面公式中是负号），用以趋近最低点 00:12:34.364 学习率最好选的小一点上面的算法思想： ==贪心== 00:14:53.079 ...

5pytorch实现线性回归

使用随机梯度下降 00:02:18.384 00:03:07.590 上节课的例子因为梯度不会自动清零，为了使这次的梯度不影响下次的梯度，进行手工清零线性回归就是恨简单的神经网络 00:06:32.614 训练步骤： 1. 前馈:算损失 2. 反馈：算梯度 3. 更新：使用梯度下降算法更新权重 00:06:33.097 00:06:50.802 要使用mini-batch 要一次性将ŷ求出来所以需要使用矩阵运算这里运用numpy的广播方式 00:09:36.616 就是矩阵扩充 00:10:14.863 00:11:06.105 w应该是3x3 00:12:01.227 00:12:13.883 实际上也就是向量化00:12:48.104 00:12:53.501 00:13:20.043 00:14:06.039 potrch中计算导数不再是重点因为00:13:52.605 有函数会自动计算导数重点在于构造计算图00:14:28.914 00:14:57.107 这个被称为一个线性单元 ...