python缺失值的解决方法

  • 更新时间:2021-06-25 10:11:59
  • 编辑:索项禹
本站精选了一篇相关的编程文章,网友焦沛雯根据主题投稿了本篇教程内容,涉及到Python相关内容,已被401网友关注,涉猎到的知识点内容可以在下方电子书获得。

参考资料

正文内容

码农之家最近发表了一篇名为《python缺失值的解决方法》的py文章,好久没看到这么好的Py技术类文章,这里给大家转摘到这里,为了大家阅读方便。

python缺失值的解决方法

1、解决方法

(1)忽视元组。

缺少类别标签时,通常这样做(假设挖掘任务与分类有关),除非元组有多个属性缺失值,否则该方法不太有效。当个属性缺值的百分比变化很大时,其性能特别差。

(2)人工填写缺失值。

一般来说,这种方法需要很长时间,当数据集大且缺少很多值时,这种方法可能无法实现。

(3)使用全局常量填充缺失值。

将缺失的属性值用同一常数(如Unknown或负无限)替换。如果缺失值都是用unknown替换的话,挖掘程序可能会认为形成有趣的概念。因为有同样的价值unknown。因此,这种方法很简单,但不可靠。

(4)使用与给定元组相同类型的所有样本的属性平均值。

(5)使用最可能的值填充缺失值。

可以通过回归、使用贝叶斯形式化的基于推理的工具和决策树的总结来决定。

2、实例

import numpy as np
 
from sklearn.preprocessing import Imputer
 
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
 
import numpy as np
from sklearn.preprocessing import Imputer
 
###1.使用均值填充缺失值
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit([[1, 2], [np.nan, 3], [7, 6]])
 
X = [[np.nan, 2], [6, np.nan], [7, 6]]
print(imp.transform(X))  
[[4.         2.        ]
 [6.         3.66666667]
 [7.         6.        ]]

以上就是python缺失值的解决方法,希望对大家有所帮助。

相关教程

  • Python 隐藏输入密码时屏幕回显的实例

    今天小编就为大家分享一篇Python 隐藏输入密码时屏幕回显的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

    发布时间:2019-06-03

  • python实现合并两个排序的链表

    这篇文章主要为大家详细介绍了python实现合并两个排序的链表,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

    发布时间:2019-06-03

用户留言