2865-杨同學-算法方向-数据挖掘-就业：是 - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训| - Powered By EduSoho

2865-杨同學-算法方向-数据挖掘-就业：是

2865-杨同學-算法方向-数据挖掘-就业：是 2865-杨同學-算法方向-数据挖掘-就业：是扫二维码继续学习二维码时效为半小时

(0评价)

价格：免费

班级有效天数：266天

学员(1)
课程(0)
分享

承诺服务

练
试
问
疑
动
业

排序：最新笔记
- 最新笔记
- 点赞最多

Expand/repeat

Expand——broadcasting仅仅是把数据进行了传播，节约内存

仅仅局限于从1开始扩展，如果是从3拓展的话，是不可行的，会报错

Repeat——实实在在的数据拷贝

1512_N_小星星 · 2021-05-26 · 自由式学习 0

squeeze、unsqueeze

for example

1512_N_小星星 · 2021-05-26 · 自由式学习 0

数据的存储、维度顺序非常重要，需要时刻谨记

1512_N_小星星 · 2021-05-26 · 自由式学习 0

索引与切片

1512_N_小星星 · 2021-05-26 · 自由式学习 0

4、rand、rand_like、randint

rand随机生成在[0, 1]的数值

rand_like是先把rand生成的数组读取出来再喂给rand函数

randint需要给出最大值、最小值和shape

1512_N_小星星 · 2021-05-26 · 自由式学习 0

创建tensor

（1）从numpy进行导入

（2）从list里面导入

小写的tensor括号里接收的是现有数据，而大写Terson、FloatTensor里面接受的是形状，也可以接受现成的数据，括号里用中括号时表示现成的数据，括号时输入的形状

1512_N_小星星 · 2021-05-26 · 自由式学习 0

Dim1

一般会用在bias、线性层的输入

Dim2

一般用在batch，当输入多张图片时，第一个数字是图片的个数，第二个是打平图片之后的一维点数

Dim3

适合RNN的文字处理

Dim4

适合CNN

第一个数字是图片的个数，第二个数字是图片的通道，通道为1是灰色图像，通道为3的是菜色图像，后两位数字28*28是minis数据集的长和宽

1512_N_小星星 · 2021-05-26 · 自由式学习 0

pytorch中的数据类型

没有对string的支持内键

how to denote string

（1）One-hot并不体现语义

（2）Embedding—word2vec

核实数据类型

数据类型

（1）标量

1512_N_小星星 · 2021-05-26 · 自由式学习 0

回归问题实战

（1）先计算总损失值

（2）然后计算w和b的偏导，进而更新梯度值

1512_N_小星星 · 2021-05-25 · 自由式学习 0

需要四步：
（1）load data

（2）build model

（3）train

（4）test

1512_N_小星星 · 2021-05-25 · 自由式学习 0

Non-linear Factor

加入激活函数之后

pred既有线性表达能力，还有非线性的表达能力

1512_N_小星星 · 2021-05-25 · 自由式学习 0

pytorch的功能：
（1）CPU加速；

没有显卡，用不了cuda

（2）自动求导*非常重要，因为深度学习本质上就是在利用梯度下降法来求最优解；

（3）常用网络层

1512_N_小星星 · 2021-05-25 · 自由式学习 0

静态图：

define——>run

在最开始就需要定义好公式，给定输入值，得到输出值，而且在运行的过程中无法进行调整

动态图：

可以随时调整公式

1512_N_小星星 · 2021-05-25 · 自由式学习 0

linear Regression——我们要估计连续函数的值；

logistic Regression——在上述linear regression的基础上增加了一个激活函数，把y的空间压缩到0-1的范围，0-1可以表示一个概率

classification——所有的可能性概率之和为1

1512_N_小星星 · 2021-05-25 · 自由式学习 0

数据降维

1.特征选择

2.主成分分析

1820_Y_Daisy · 2021-05-22 · 自由式学习 0

MinMaxScaler(feature_range=())

feature_range 可以指定在一定的数值范围内

1820_Y_Daisy · 2021-05-22 · 自由式学习 0

tf idf

tf:term frenquency词的频率出现的次数

idf:inverse document frequency 逆文档频率

log(总文档数量/该词出现的文档数量)

重要性程度

1820_Y_Daisy · 2021-05-22 · 自由式学习 0

countvectorizer没有参数

文本都是放在列表里面的可迭代对象

1820_Y_Daisy · 2021-05-22 · 自由式学习 0

性能瓶颈，读取速度

格式不太符合机器学习要求数据的格式

可用数据集:

Kaggle

UCI

scikit-learn

1820_Y_Daisy · 2021-05-21 · 自由式学习 0

机器学习是从数据中自动分析获得规律(模型)，并利用规律对未知数据进行预测

1. 解放生产力

2.解决专业问题

3.提供社会便利

1820_Y_Daisy · 2021-05-21 · 自由式学习 0