您当前的位置: 首页 >  彭世瑜 机器学习

机器学习:数据特征预处理缺失值处理

彭世瑜 发布时间:2019-01-13 18:47:46 ,浏览量:3

缺失值处理

删除:如果行或列数据缺失值达到一定比例,建议放弃整行或列 插补:填补列的平均值,中位数

numpy数组中的缺失值 nan/NaN 属于float类型

代码示例
from sklearn.preprocessing import Imputer
import numpy as np

# 缺失值处理
data = [
    [1, 1, 3],
    [np.nan, 4, 6],
    [7, 3, 5]
]

im = Imputer(missing_values="NaN", strategy="mean", axis=0)
result = im.fit_transform(data)
print(result)
"""
[[1. 1. 3.]
 [4. 4. 6.]
 [7. 3. 5.]]
"""
关注
打赏
1688896170
查看更多评论

彭世瑜

暂无认证

  • 3浏览

    0关注

    2727博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录

0.0519s