深度学习顺序 1. 准备数据集 2. 模型选择 3. 训练 4. 推理 00:01:57.536 image.png

00:02:38.739 image.png

00:03:56.345 image.png

仅有输入的数据,在测试或者推理阶段

00:04:40.157 image.png

数据集交给算法,得到预测算法,使用模型只进行预测

00:05:46.753 image.png

知道输出值-》监督学习

测试集用于评价模型好坏

数据集分成两个部分 00:08:42.608 image.png

00:10:06.592 image.png

00:12:21.957 image.png

00:13:54.806 image.png

深度学习训练最大问题:过拟合 过拟合:把图像中的噪声也学进去了 比如训练集中的小猫都很可爱,但是测试集的小猫不可爱,导致测试中无法准确识别

需要模型有比较好的泛化能力

训练集分成两份 开发集用于对训练集进行评估,防止过拟合 评估比较好好再把所有的训练集重新训练,之后丢给测试集 00:15:00.775 image.png

00:17:13.524 image.png

其实就是找到f(x) 线性模型是最基本的,可以最开始测试是否可用

预测出来的加上y heater 00:20:28.689 image.png

如何找到斜率为2

00:21:44.731 image.png

(k) − y(k) 偏差值用于评估数据值与实际值之间的偏差

00:23:46.391 image.png

00:25:59.132 image.png

00:27:17.885 image.png

mean是平均loss image.png 00:28:34.368 image.png 损失函数 平均平方误差(mse)

00:29:37.160 image.png 使用穷举法的思路 就是挨个w计算损失 00:30:41.118

image.png 在所有损失中选取最小的 00:32:32.288 image.png

前馈函数 00:32:11.320 image.png

数据集保存 输入输出要分开

相同的样本是一类,比如1和右边的0是一对 00:32:22.783

00:32:42.605 image.png

损失函数 00:33:04.537 image.png 两个列表用于存放权重权重对应的损失值

00:33:40.332 image.png

间隔为0.1 00:33:57.217 image.png

前馈 计算损失 损失值相加,没有均值 00:35:32.139 image.png 画图

这个表不很常用

因为上面这个图很难用来判断是否收敛 最常使用epoc(轮数)作为横坐标 00:37:18.063 image.png

00:37:29.365 image.png 上面是训练集的图像

下面红色的是开发集的数据00:37:55.434 image.png

00:38:03.049

image.png

这个点是收敛点

深度学习需要可视化,python绘图

常用visdom

00:42:33.380 image.png

np中的meshgrid()很重要