文章目录
- 1. 载入各种数据科学以及可视化库
- 2. 载入数据
-
- 2.1. 特征集
- 2.2. 简略观察数据
- 3.数据总览
-
- 3.1. 通过describe()对于特征进行一些统计描述
- 3.2. 通过info()来熟悉数据类型
- 4. 判断数据缺失和异常
-
- 4.1. 查看每列的存在nan情况
- 4.2. 查看缺失值的分布情况
- 4.3. 查看有效值的占比情况
- 4.4. 异常值处理
- 4.5. 无效数据处理
- 5. 了解预测值的分布
-
- 5.1. 总体分布概况
- 5.2. 查看skewness and kurtosis
-
- 偏度(Skewness)
- 峰度(Kurtosis)