自由式学习
936人加入学习
(0人评价)
机器学习算法基础(基础机器学习课程)
价格 免费
承诺服务
该课程属于 1446-肖同学-算法方向-计算机视觉-就业:否 请加入后再学习

【sklearn 数据集】

- 数据集的划分:将数据集划分为训练集(建立模型)和测试集(评估模型)

- sklearn数据集划分API:sklearn.model_selection.train_test_split

--sklearn.datasets:加载获取流行数据集

1. datasets.load_*():获取小规模数据集,数据包含在datasets中

2. datasets.fetch_*(data_home=None):获取大规模数据集

--获取数据集返回的类型为datasets.base.Bunch(字典格式)

---data:特征数据数组,是 [n_samples*n_features] 的二维 numpy.ndarray 数组

---target:标签数组

---DESCR:数据描述

---feature_names:特征名

---target_names:标签名

 

[展开全文]

# 数据的划分和介绍

## 1、sklearn 数据集

### 数据集划分

- 训练集 占大多数 70% 80% 75% 构建模型

- 测试集  30% 20% 25% 用于评估模型是否有效

sklearn.model_selection.train_test_split

 

 

 

[展开全文]