Pytorch学习 - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训| - Powered By EduSoho

1151人加入学习

(0人评价)

Pytorch学习

价格免费

教学计划

学习有效期 365 天（随到随学）

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

该课程属于 1458-Hayden-算法方向-计算机视觉-就业：是请加入后再学习

排序：最新笔记
- 最新笔记
- 点赞最多

2、输入门

it作为一个开度，将多少信息传入到下一个时间点，有算法决定这个开度；新信息同样也是由ht-1和当前点的xt共同决定的。it是对当前信息的过滤系数，当前信息与开度相乘之后就是经过过滤后输入下一个点的新信息。

输入门的值

ct是memory，ht是隐藏层的输出

3、输出值

同样是由开度和ct共同决定的，ot作为开度也是由算法决定的

LSTM如何解决梯度离散的问题呢？

由于存在忘记门、输入门和输出门三个门

当前隐藏层对前一个隐藏层求导时，出现三个值相加的情况，不容易出现都是大或都是小的情况，数值相对可靠，所以效果相对来说更好一些。

1512_N_小星星 · 2021-06-20 · 课时93 LSTM原理-2.mp4 0

LSTM将短期记忆变长，RNN只能记住比较短的时间序列，LSTM就是为了解决短期记忆的问题。

1、忘记门

1512_N_小星星 · 2021-06-20 · 课时92 LSTM原理-.mp4 0

梯度爆炸

why？

梯度是有WR的k次方乘以其他的一些东西得到的

当WR大于1的时候，k次方会非常大

当WR小于1的时候，k次方会接近于0

我们的loss本来是逐渐变小的，发生梯度爆炸的loss会突然增大，为了解决这个问题，我们可以检查当前位置的梯度值，如果大于我们设定的阈值，我们将用梯度本身来除以她此刻的模，再乘以阈值，这样使得梯度在设定范围内，且方向不发生变化

Gradient Clipping

查看一下梯度的模，利用clip_grad_norm把梯度的裁剪到10左右

梯度离散：后面隐藏层梯度变化比较大，前面的隐藏层梯度变化很小，长时间得不到更新

1512_N_小星星 · 2021-06-20 · 课时91 梯度弥散与梯度爆炸.mp4 0

out是所有的时间戳上面最后一个memory状态

h是左右一个时间的所有memory状态

1512_N_小星星 · 2021-06-10 · 课时89 RNN Layer使用-2.mp4 0

1512_N_小星星 · 2021-06-10 · 课时88 RNN Layer使用-1.mp4 0

memory的更新方式

How to train?

求导过程略

1512_N_小星星 · 2021-06-10 · 课时87 RNN原理-.mp4 0

RNN循环神经网络

RNN跟CNN最大的区别是会根据语境信息更新

1512_N_小星星 · 2021-06-09 · 课时86 RNN原理-1.mp4 0

时间序列表示方法

pytorch里面并没有支持字符串的功能

one_hot是比较稀疏的、维度高

sequence序列能接受的input shape有两种

[word num, b, word vec]

[b, word num, word vec]

1512_N_小星星 · 2021-06-09 · 课时85 时间序列表示方法.mp4 0

CIFAR—10数据集包括了常见的十类事物的图片

每一类有6000张图片，一共有6万张，其中5万张用来训练，1万张用来测试

1512_N_小星星 · 2021-06-07 · 课时76 CIFAR10数据集介绍.mp4 0

数据增强

神经网络对数据的要求非常饥渴，需要贴有标签的大量数据

当数据量有限的时候：1、要减少神经网络的隐藏层；2、Regularization，迫使一部分权值接近于0，让网络的表现更加稳定；3、数据增强，目前的数据量较少，想办法对数据进行变换——旋转、裁剪加噪声等

Flip——翻转

可以从水平方向和竖直方向进行翻转，这里增加了random属性，代表翻转是具有随机性的，有可能进行水平翻转，也有可能不翻转，有可能垂直翻转，也有可能不翻转

Rotate——旋转

Scale——缩放

以中心点为标准进行缩放Resize，传入的是list

Crop Part

随机得进行裁剪

transform是torchvision里面自带的包， transform.Compose（）可以把一系列翻转、旋转、裁剪和缩放操作组合在一起

Noise——加噪声，用的不多

即使得到了无穷多的数据，由于进行变换后的数据和原本的数据非常接近，所以训练的结果仅仅能得到一个很小的提升

1512_N_小星星 · 2021-06-07 · 课时75 数据增强.mp4 0

4、save和load

5、train和test状态切换很方便

6、implement own layer

由于实际需要定义一个flatten类，我们通过nn.Sequential()来把函数有序排列起来组成我们主要的神经网络结构

7、通过nn.Parameter( )实现自己的参数定义

1512_N_小星星 · 2021-06-06 · 课时74 nn.Module模块-2.mp4 0

nn.Module的好处

提供了很多现成的网络层

1、container——nn.Sequential()

将神经网络内部的结构按照顺序进行编码

net = nn.Sequential()可以直接实现网络前向传播

2、其次，通过net.parameters( )可以返回想要的参数；也可以通过net.parameters( )把参数丢到优化器里

3、modules里面包括了所有的节点；里面包括很多子节点——直系亲属

整个net有5个节点

1512_N_小星星 · 2021-06-06 · 课时73 nn.Module模块-1.mp4 0

DenseNet跟ResNet一样都有shortcut短接，以使得及时是很深的网络其性能也不必浅层的网络差，不一样的是后面的每一层网络都有可能与前面任意一层网络形成短接

最上面的没有短接的神经网络

第二个是Resnet

最后一个是DenseNet

从图片上可以看出来区别

1512_N_小星星 · 2021-06-06 · 课时72 ResNet与DenseNet-2.mp4 0

1512_N_小星星 · 2021-06-06 · 课时71 ResNet与DenseNet-1.mp4 0

VGG

研究发现卷积核较小的时候不仅可以提高运算量，且对图片benshen

GoogLeNet

在每个隐藏层都使用了不同大小的卷积核，从不同的视觉大小更深刻得学习图片

1512_N_小星星 · 2021-06-06 · 课时70 经典卷积网络 LeNet5,AlexNet, VGG, GoogLeNet-2.mp4 0

leNet-5将准确率提升了10%+

AlexNet使用了下采样层和relu激活函数

1512_N_小星星 · 2021-06-06 · 课时69 经典卷积网络 LeNet5,AlexNet, VGG, GoogLeNet-1.mp4 0

Batch Norm有以下四种，只是以哪个维度为标准的区别

我们主要学习Batch normalization以通道为基准，计算每个通道上的均值和方差，然后通过减均值除以方法来使这些值均匀得分布在某个范围内

规范化算法计算均值和方差、标准化、缩放

在测试集上，我们把训练集的runnnig_mean/running_var直接赋值给训练集，test没有backward，所有w和b并不需要更新，不需要梯度更新

1512_N_小星星 · 2021-06-06 · 课时68 BatchNorm-2.mp4 0

BatchNorm

将不同维度的值都缩放到一个以0为均值，以某个值为方差的比较均匀的分布上

Feature scaling

输入R、G、B各通道的均值和方差，normaliazation的具体过程是

1512_N_小星星 · 2021-06-06 · 课时67 BatchNorm-1.mp4 0

池化层（pooling）

向下采样：

Max pooling

采集的是窗口内的最大值

Avg pooling

采集的是窗口数值的均值

向上取样，把图片方法，取最近距离的值进行简单的复制

1512_N_小星星 · 2021-06-06 · 课时66 池化层与采样.mp4 0

Multi-Kernels

每一个通道上都需要有相同的卷积核，每个通道可以有1个2个甚至更多的卷积核，但是每个通道上的卷积核都必须相同！每个核之间可以不同

1512_N_小星星 · 2021-06-06 · 课时64 卷积神经网络-2.mp4 0

深度学习-Tensorflow2.0

深度学习-Tensorflow2.0

897 0

知识图谱

55 0

2、（Part Two）深度学习进阶

2、（Part Two）深度学习进阶

12 0

1、（Part One）深度学习基础

1、（Part One）深度学习基础

12 0

授课教师

森陌夏栀

高级算法工程师

teacher03

teacher02

teacher01

老师

课程特色

考试(9)

图文(1)

视频(151)

最新学员

学员动态

3873辜开始学习课时63 卷积神经网络-1.m...

王一完成了 Pytorch课程学习课件

王一开始学习 Pytorch课程学习课件

3456 开始学习课时1 深度学习框架简介.mp...

3689_Y_朱育林完成了课时35 什么是梯度-2.mp...