1201-马同学-算法方向-大数据挖掘方向-就业:是 扫二维码继续学习 二维码时效为半小时

(0评价)
价格: 免费

【sklearn 数据集】

- 数据集的划分:将数据集划分为训练集(建立模型)和测试集(评估模型)

- sklearn数据集划分API:sklearn.model_selection.train_test_split

--sklearn.datasets:加载获取流行数据集

1. datasets.load_*():获取小规模数据集,数据包含在datasets中

2. datasets.fetch_*(data_home=None):获取大规模数据集

--获取数据集返回的类型为datasets.base.Bunch(字典格式)

---data:特征数据数组,是 [n_samples*n_features] 的二维 numpy.ndarray 数组

---target:标签数组

---DESCR:数据描述

---feature_names:特征名

---target_names:标签名

 

[展开全文]

-数据类型

1. 离散数据类型(计数数据):区间内不可分,整数,不能进一步提高精确度

2. 连续性数据:区间内可分,通常为非整数。变量可以在某个范围内任取数。

 

- 机器学习算法分类

1. 监督学习(预测):特征值+目标值

1.1 分类(目标值为离散型):k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络

1.2 回归(目标值为连续型):线性回归、岭回归

1.3 标注:隐马尔科夫模型

2. 非监督学习:特征值

2.1 聚类 k-means

[展开全文]

- 特征抽取:将文本等原始数据转化为特征向量的形式

 

[展开全文]

- 常用数据集数据的结构组成:特征值 + 目标值(有些数据集可以没有目标值)

- 样本:一组数据也可以称为一个样本。

- 数据中对于特征的处理:

1. pandas:工具。数据读取非常方便,可以处理数据的基本格式

2. sklearn:可以对特征进行处理——这类处理被称为特征工程

# 机器学习不需要对样本进行去重

【特征工程】

- 特征工程是将原始数据转换为能更好地代表预测模型的潜在问题的特征的过程,从而提高对未知数据的预测准确性

- 安装scikit-learn

[展开全文]

- 机器学习的数据:文件 csv

- 不用mysql的原因:

1. 具有性能瓶颈、读取速度慢

2. 格式不符合机器学习要求数据的格式

- pandas:读取数据的工具

- numpy(读取速度快)

- 可用数据集:Kaggle、UCI、scikit-learn

- 常用数据集数据的结构组成:特征值 + 目标值(有些数据集没有目标值)

 

[展开全文]

- 什么是机器学习:数据中自动分析获得规律(模型),利用规律对未知数据进行预测

 

[展开全文]

- 影响人工智能发展的重要因素:计算能力、数据大小、算法发展

- 使用场景:无人驾驶的场景识别、图片艺术化、医用彩超辨别、需求销量等数据预测

- 机器学习领域:自然语言处理、图像识别、传统预测

- 机器学习库和框架:scikit learn(机器学习)、tensorflow(深度学习)

- 书籍:统计学习方法、机器学习、python数据分析与挖掘实战、机器学习系统设计、面向机器智能tensorflow实践

- 课程概要:特征工程、模型策略优化、分类回归聚类、tensorflow、神经网络、图像识别、自然语言处理

[展开全文]

python不适用的场景为效率性能要求较高的场景。c/go/java/c++都比他性能高。

[展开全文]
3594_N_ZDQ · 2022-12-02 · 自由式学习 0

for 遍历所有数值

print(输出便利数值)

for x in 数值

print()

 

[展开全文]
3589 · 2022-11-08 · 自由式学习 0

海龟绘图我pycharm无法输出

[展开全文]
  1. 不要在程序中,行开头处增加空格,空格在py中含有缩进的意义
  2. 符号是英文符号
[展开全文]

关键字,不能作为变量名,使用help()查看关键字,变量以字母或者下划线开头,后接字母下划线数字

[展开全文]
56493 · 2022-09-15 · 自由式学习 0

字符串的变量

可用 == 和 is 来判断是否是同个id

只有包含下划线字母数字的字符才能进入驻留,特殊符号不可以,所以id会发生变化。

字符串成员操作符: in , not in

 

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0

1.split(x) 以'x'为界限分割字符串 x可以是空格,单字符,多字符

2.‘x’.join(y) y中的字符串,以x为分隔,拼接成一个大字符串

 

 

 

 

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0

使用【:】取字符串的片段

[:]:取全部

[2:]从第三个位置到最后 

[2:5]从第三个位置到第五个位置 注:包头不包尾

[1:5:x] 在位置1:5之间每隔x取一个

也可以用'-'号进行反向取值,同样包头不包尾

[::-1],反向排

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0

1.str() 注:转化数据为字符串

2.通过[]提取字符串 注:第一个字符为0,最后一个字符为len(str)-1,既可以正向提取,也可以反向向提取

3.replace在字符串中的应用

例:a = 'xy'

  a.replace('x','y')

  print(a)

  输出: 'yy'

 

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0

1.转义符号的使用

2.字符串可通过+进行拼接操作(需两个为字符串)

3.字符串可通过*号进行复制

4.通过end=“”,来避免换行

使用 input()从控制台读取键盘输入内容

myname = input('请输入名字:')

请输入名字:x

print(myname)

输出 'x'

 

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0

1.同一运算符:is ,is not

区别:is判断的是地址

         ==判断的是值

注:在-5,256之间数值会缓存,所以id是相同的,不同解释器不同

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0

1.布尔值本质是1和0

2.布尔值的比较运算符:等于,不等于,大于,小于,大于等于,小于等于

返回:True和False

3.逻辑运算符:或or,与and,非not

[展开全文]
cmt_3325 · 2022-08-26 · 自由式学习 0