2线性模型

发表于2025-11-12|更新于2025-11-12|pytorch刘二大人

|浏览量:

深度学习顺序 1. 准备数据集 2. 模型选择 3. 训练 4. 推理 00:01:57.536

仅有输入的数据，在测试或者推理阶段

数据集交给算法，得到预测算法，使用模型只进行预测

知道输出值-》监督学习

测试集用于评价模型好坏

数据集分成两个部分 00:08:42.608

深度学习训练最大问题：过拟合 过拟合：把图像中的噪声也学进去了比如训练集中的小猫都很可爱，但是测试集的小猫不可爱，导致测试中无法准确识别

需要模型有比较好的泛化能力

训练集分成两份开发集用于对训练集进行评估，防止过拟合评估比较好好再把所有的训练集重新训练，之后丢给测试集 00:15:00.775

其实就是找到f(x) 线性模型是最基本的，可以最开始测试是否可用

预测出来的加上y heater 00:20:28.689

如何找到斜率为2

ŷ(k) − y(k) 偏差值用于评估数据值与实际值之间的偏差

mean是平均loss 00:28:34.368 损失函数平均平方误差（mse）

00:29:37.160 使用穷举法的思路就是挨个w计算损失 00:30:41.118

在所有损失中选取最小的 00:32:32.288

前馈函数 00:32:11.320

数据集保存输入输出要分开

相同的样本是一类，比如1和右边的0是一对 00:32:22.783

损失函数 00:33:04.537 两个列表用于存放权重和 权重对应的损失值

间隔为0.1 00:33:57.217

前馈计算损失损失值相加，没有均值 00:35:32.139 画图

这个表不很常用

因为上面这个图很难用来判断是否收敛最常使用epoc（轮数）作为横坐标 00:37:18.063

00:37:29.365 上面是训练集的图像

下面红色的是开发集的数据00:37:55.434

image.png

这个点是收敛点

深度学习需要可视化，python绘图

常用visdom

np中的meshgrid()很重要

文章作者: Xing

文章链接: http://example.com/2025/11/12/pytorch%E5%88%98%E4%BA%8C%E5%A4%A7%E4%BA%BA/2%E7%BA%BF%E6%80%A7%E6%A8%A1%E5%9E%8B/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Xing！

编程调试学习资源神经网络深度学习 PyTorch 刘二大人线性回归数据集 Python

相关推荐

目标实现一个学习系统理解简单的神经网络（nn）/dl 00:11:46.636 人类智能 1. 通过信息进行推理 2. 看到照片与抽象概念结合：预测 00:19:29.936 mechine learning 就是代替人脑目前常用的都是监督学习算法思维： - 穷举 - 贪心 - 分治 - 动态规划深度学习：有数据集找出算法机器学习计算过程也就是函数来源于数据，而不是人工（基于统计） 00:24:01.499 dl属于表示学习rl 00:28:28.199 求原函数首先构造知识库 00:29:14.598 00:29:41.156 实现类似人类智能的就算ai 00:32:34.716 对于复杂问题，基于规则的代码，人类难以维护经典机器学习：手工提取特征。最重要要把 00:34:05.608 重点是使用机器学习找到中间的f(x) 00:34:40.521 表示学习还要通过学习获得特征维度诅咒 00:36:43.485 特征2维就需要102 如果是3维就103 00:39:08.956 10维空间映射到3维 0...

3梯度下降算法的实现

00:02:00.228 使用随机猜测寻找ŷ − y 最小值 00:03:10.941 00:03:41.947 两个权重w1 w2 00:04:06.938 这个搜索量太大了穷举法搜不过来搜索区间过大导致问题 ==分治思想== 00:05:02.292 00:05:11.770 对于两个权重，进行划分，只考虑这点00:06:02.911 image.png 使用这几个点代表所有的空间 00:07:07.962 00:07:29.136 分治思想的缺点，会有如上的情况，导致无法获取最低点。有可能会错过比较好的低点 00:09:26.071 要求函数的最小值 00:10:16.901 00:10:41.308 00:11:34.211利用梯度来判断这个点需要进行的平移方向，也就是如果梯度导数 > 0 ,也就是这个点右移会上升所以应该选择导数的负方向（下面公式中是负号），用以趋近最低点 00:12:34.364 学习率最好选的小一点上面的算法思想： ==贪心== 00:14:53.079 ...

6逻辑斯蒂回归

mnist数据集 00:01:43.327 手写数据的数据集 10个分类 00:02:24.593 判断y属于集合中的哪一个，这个叫做分类问题 00:06:02.081 表示他属于某一个类的概率，选择最大的 00:06:54.719 torchvison包含了一些典型的训练集 train=1-> train train=0 ->test 00:09:23.751 00:10:34.118 y的值维0 或1 这个叫做二分类问题 00:13:38.275 00:14:36.865 00:16:18.710 00:16:31.844 00:17:54.518 左图被称为饱和函数 00:18:19.386 00:19:19.394 将ŷ带入σ(x) 就可以将ŷ 的范围限制在（0，1） 00:20:49.142 sigmid函数的条件： 1. 函数值有极限 2. 单调增函数 3. 饱和函数 logistic是sigmid中最典型的函数，所以约定俗成就用logistic代替sigmid，但实际上sigmid还有很...

00:02:09.538 dataset用于将数据进行标记，标记label 00:02:52.896 dataloader为网络提供不同的数据形式 00:04:13.403 dateset需要考虑，主要实现以下功能 - 如何获取每一个数据以及label - 告诉我们总共有多少数据 00:05:51.702 00:05:48.542 数据集分为训练数据集和测试数据集第二种数据集00:07:12.051 这里面还有标注的label 或者直接把label直接标注在图片上配置终端代理前配置终端代理后，网速还是很感人 12set HTTP_PROXY=http://127.0.0.1:7890set HTTPS_PROXY=http://127.0.0.1:7890 nnd还是失败了一样的报错还是，加载超时 image.png nnd网络抽风要测试您的代理配置是否成功，有几种方法可以查看您是否能够通过代理访问外部网络。以下是一些常用的测试方法：方法 1: 使用 curl 命令如果您的系统上安装了 curl，您可以在命令提示符中...

9多分类问题

使用softmax 00:01:46.755 00:01:58.457 十个分类神经网络应该如何设计 00:03:21.365 希望的要求：输出之间竞争性输出就是一个分布 1. 概率大于0 2. 概率求和为1 00:08:00.963 00:09:30.429 00:10:29.210 求和之后结果为100:12:58.619 00:13:42.719 00:14:09.852 00:14:49.264 00:14:59.977 交叉熵 00:18:14.365 00:19:17.457 00:19:36.942 00:20:50.262 00:21:47.606 00:22:31.144 最后一层是不需要手动进行非线性激活的，因为交叉熵损失会直接激活 00:24:38.539 00:24:21.657 2表示这个第二个元素最大 0表示第0个元素最大 1表示第一个元素最大 y_pred和预测的比较拟合，所以第一个预测算出来的损失会比较小 00:26:14.653 00:26:40.399 思考交叉熵和nl...

11卷积神经网络（高级）

之前学习的都是线性的串行结构就是上一个的输出作为下个的输入 00:02:06.381 convoltion：卷积 pooling：池化 softmax：输出 other：拼接层为了减少代码冗余： - 使用函数调用 - 构造类 00:04:05.180 发现这些快长得都一样所以把其封装成类 00:06:02.235 有一些参数比较难选比如kernel选哪个， googlenet的思路是，再一个块中，使用多个kernnel 然后对结果进行评价，让最优的kernel权重增加 00:09:21.370 对于每一条路，变换之后bwh必须相同 c可以不同 00:11:39.744 00:11:51.236 00:11:59.066 00:13:31.719 00:13:30.545 00:13:30.545 求和也就是信息融合 00:17:39.604 00:19:24.494 上面这个的运算量太大了 00:20:06.613 直接变为原来的十分之一这个也就是1x1的卷积神经网络的作用网络中的网络：1x1卷积 00:...