3629-耀同学-Python学科-数据分析 已关闭

3629-耀同学-Python学科-数据分析 扫二维码继续学习 二维码时效为半小时

(0评价)
价格: 免费

-数据类型

1. 离散数据类型(计数数据):区间内不可分,整数,不能进一步提高精确度

2. 连续性数据:区间内可分,通常为非整数。变量可以在某个范围内任取数。

 

- 机器学习算法分类

1. 监督学习(预测):特征值+目标值

1.1 分类(目标值为离散型):k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络

1.2 回归(目标值为连续型):线性回归、岭回归

1.3 标注:隐马尔科夫模型

2. 非监督学习:特征值

2.1 聚类 k-means

[展开全文]

- 特征抽取:将文本等原始数据转化为特征向量的形式

 

[展开全文]

- 常用数据集数据的结构组成:特征值 + 目标值(有些数据集可以没有目标值)

- 样本:一组数据也可以称为一个样本。

- 数据中对于特征的处理:

1. pandas:工具。数据读取非常方便,可以处理数据的基本格式

2. sklearn:可以对特征进行处理——这类处理被称为特征工程

# 机器学习不需要对样本进行去重

【特征工程】

- 特征工程是将原始数据转换为能更好地代表预测模型的潜在问题的特征的过程,从而提高对未知数据的预测准确性

- 安装scikit-learn

[展开全文]

- 机器学习的数据:文件 csv

- 不用mysql的原因:

1. 具有性能瓶颈、读取速度慢

2. 格式不符合机器学习要求数据的格式

- pandas:读取数据的工具

- numpy(读取速度快)

- 可用数据集:Kaggle、UCI、scikit-learn

- 常用数据集数据的结构组成:特征值 + 目标值(有些数据集没有目标值)

 

[展开全文]

- 什么是机器学习:数据中自动分析获得规律(模型),利用规律对未知数据进行预测

 

[展开全文]

- 影响人工智能发展的重要因素:计算能力、数据大小、算法发展

- 使用场景:无人驾驶的场景识别、图片艺术化、医用彩超辨别、需求销量等数据预测

- 机器学习领域:自然语言处理、图像识别、传统预测

- 机器学习库和框架:scikit learn(机器学习)、tensorflow(深度学习)

- 书籍:统计学习方法、机器学习、python数据分析与挖掘实战、机器学习系统设计、面向机器智能tensorflow实践

- 课程概要:特征工程、模型策略优化、分类回归聚类、tensorflow、神经网络、图像识别、自然语言处理

[展开全文]

sudo进行用户切换。

$一般账户

#超级管理员

 

[展开全文]

微信,如何实现多用户操作?

whoami我是哪个账户。

exit切回去。

 

[展开全文]

cat显示文件内容

mv重新命名文件名移动

 

ln链接快捷键

ln -硬链接相当于复制

cat 1 2》3

把1和2合并到3里。

grep搜索

ls显示文件

cp复制粘贴

-r解决文件夹不让动。

 

 

 

[展开全文]

rmdir 删除文件夹

rm -r可以删非空文件

 

[展开全文]

ctrl+c删除命令行。

mkdir创建文件夹

tree以目录树的方式显示文件夹

-p自动创建文件夹

 

[展开全文]

while循环

print()光标会进入下一行。

 

[展开全文]

btreak跳出循环结构

 

[展开全文]

for in  else

pass break

 

[展开全文]

print(2《1)左移

6位数表示颜色。

围绕进进制。

[展开全文]

0s十次进制

8进制转二进制,三个一位,

16进制转二进制,四个一位。

&|!与或非

非取反操作。

 

[展开全文]

位运算一般可以用于密码

bin转二进制

0b表示二进制

0o表示八进制

 

[展开全文]