3085-张启成-人工智能学科-数据挖掘方向-就业：否 - 拜师教育 - 师徒制教育平台|人工智能培训|大数据培训|JAVA培训|PYTHON培训| - Powered By EduSoho

3085-张启成-人工智能学科-数据挖掘方向-就业：否

3085-张启成-人工智能学科-数据挖掘方向-就业：否 3085-张启成-人工智能学科-数据挖掘方向-就业：否扫二维码继续学习二维码时效为半小时

(0评价)

价格：免费

班级有效天数：380天

学员(1)
课程(31)
分享

承诺服务

练
试
问
疑
动
业

排序：最新笔记
- 最新笔记
- 点赞最多

sympy 符号计算

1820_Y_Daisy · 2021-05-20 · 自由式学习 0

极限

1820_Y_Daisy · 2021-05-20 · 自由式学习 0

O 来自 order 大写：以多项式的最大的次项的次数大O(n) 表示 f(x) =O(g(x)) f(x)的阶与g(x)的阶相同

小写O f(x)=o(g(x)) f(x)的阶小于g(x)的阶

1820_Y_Daisy · 2021-05-20 · 自由式学习 0

梯度下降法

1512_N_小星星 · 2021-05-19 · 自由式学习 0

连续[2:5,1:4]跳跃[[2,1],[3,5]]

Dino · 2021-05-09 · 自由式学习 0

让机器学习程序替换手动步骤，减少企业的成本，也提高企业的效率

1530_Y_Breative · 2021-02-16 · 自由式学习 0

真是听过讲的最烂的，重点yong'yuan'tiao'guo

1411_Y_James · 2021-01-30 · 自由式学习 0

# Machine learning

- make decisions

- go right/left

- increse/decrease

1411_Y_James · 2021-01-25 · 自由式学习 0

# 为什么使用tensorflow

- GPU加速比cpu快很多

- 自动求导

- 神经网络API

> 给与cpu和gpu一个热身的时间：warm-up

1411_Y_James · 2021-01-24 · 自由式学习 0

数据分析的流程:

提出问题
准备数据
分析数据
获得结论
成果可视化

1535_N_calm_one · 2021-01-20 · 自由式学习 0

控制流程：顺序、条件、循环

1506_Y_本本 · 2020-12-28 · 自由式学习 0

# 非监督学习

## k-means （聚类）

> 聚类做在分类之前

1411_Y_James · 2020-12-09 · 自由式学习 0

# 分类算法：逻辑回归

> 逻辑回归：线性回归的式子作为输入，解决二分类问题，也可以得出概率值

## 1、应用场景（基础分类问题：二分类）

- 广告点击率

- 是否为垃圾邮件

- 是否患病

- 金融诈骗

- 虚假账号

## 2、广告点击

- 点击

- 没点击

## 3、逻辑回归的输入与线性回归相同

1411_Y_James · 2020-12-09 · 自由式学习 0

# 模型的保存和加载

from sklearn.externals import joblib

1411_Y_James · 2020-12-09 · 自由式学习 0

## 过拟合与欠拟合

> 问题：训练集数据训练得很好，误差也不大，在测试集上有问题原因：学习特征太少，导致区分标准太粗糙，不能准确识别处目标

- 欠拟合：特征太少

- 过拟合：特征过多

特征选择：

- 过滤式：低方差特征

- 嵌入式：正则化，决策树，神经网络

1411_Y_James · 2020-12-09 · 自由式学习 0

## 2、线性回归策略

> 预测结果与真实值有误差

> 回归：迭代的算法，知道误差，不断减小误差，

### 损失函数

- 最小二乘法之梯度下降

scikit-learn：

- 优点：封装好，建立模型简单，预测简单

- 缺点：算法的过程，有些参数都在算法API内部优化

1411_Y_James · 2020-12-09 · 自由式学习 0

## 集成学习方法-随机森林

### 集成学习方法

> 通过建立几个模型组合来解决单一预测问题。工作原理是生成多个分类器/模型，各自独立地学习和做出预测，这些预测最后结合成单预测，因此优于任何一个单分类的做出预测。

### 随机森林

> 在机器学习中，随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。多个决策树来投票

### 随机森林建立多个决策树的过程

1411_Y_James · 2020-12-08 · 自由式学习 0

# 分类算法：决策树、随机森林

## 1、认识决策树

### 决策树的划分

## 2、信息的度量和作用

> 信息的单位：比特

### 信息熵

> 信息和消除不确定性xiang'guan

1411_Y_James · 2020-12-08 · 自由式学习 0

# 模型选择与调优

## 1、交叉验证

> 为了让被评估的模型更加准确可信\

> 将训练集再分为训练集和验证集将所有数据分成n等分

##2、网格搜索：调参数

K-近邻：超参数

> 通常情况下，很多参数需要手动指定，如k值，这种叫超参数。每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建立模型

1411_Y_James · 2020-12-08 · 自由式学习 0

# 分类模型的评估

> estimator.score()

- 一般最常见使用的是准确率，即预测结果正确的百分比

## 精确率和召回率

> 预测结果为正例样本中真实为正例的比例（查得准）

> 召回率：真实为正例的样本中预测结果为整理的比例(查的全，对正样本的区分能力)

1411_Y_James · 2020-12-08 · 自由式学习 0

班主任

该定制计划尚未设置班主任

新加学员

学员动态

杜思康开始学习 2.2-Openai CLIP...

杜思康开始学习 3.3-Openai Dall...

杜思康开始学习 1.1-GPT系列算法与实战(...

杜思康开始学习 5.mp4

杜思康开始学习 9.mp4

杜思康完成了第2课 Model—Free ...