python缺失值的解决方法
- 更新时间:2021-06-25 10:11:59
- 编辑:索项禹
本站精选了一篇相关的编程文章,网友焦沛雯根据主题投稿了本篇教程内容,涉及到Python相关内容,已被401网友关注,涉猎到的知识点内容可以在下方电子书获得。
参考资料
- Python密码学编程 PDF 电子书 / 198.9 MB / Al Sweigart 斯维加特 推荐度:
- 自然语言处理的Python实践 PDF 电子书 / 15.8 MB / 马坦吉·斯里(Mathangi Sri) 推荐度:
- Python编程导论(第2版) PDF 电子书 / 12.1M / 约翰·谷泰格 推荐度:
- Python数据可视化 PDF 电子书 / 92.7 MB / 科斯·拉曼 推荐度:
- 《NLTK基础教程:用NLTK和Python库构建机器学习应用》配套资源 配套资源 / 26.71 KB / Nitin,Hardeniya,哈登尼亚 推荐度:
正文内容
码农之家最近发表了一篇名为《python缺失值的解决方法》的py文章,好久没看到这么好的Py技术类文章,这里给大家转摘到这里,为了大家阅读方便。
1、解决方法
(1)忽视元组。
缺少类别标签时,通常这样做(假设挖掘任务与分类有关),除非元组有多个属性缺失值,否则该方法不太有效。当个属性缺值的百分比变化很大时,其性能特别差。
(2)人工填写缺失值。
一般来说,这种方法需要很长时间,当数据集大且缺少很多值时,这种方法可能无法实现。
(3)使用全局常量填充缺失值。
将缺失的属性值用同一常数(如Unknown或负无限)替换。如果缺失值都是用unknown替换的话,挖掘程序可能会认为形成有趣的概念。因为有同样的价值unknown。因此,这种方法很简单,但不可靠。
(4)使用与给定元组相同类型的所有样本的属性平均值。
(5)使用最可能的值填充缺失值。
可以通过回归、使用贝叶斯形式化的基于推理的工具和决策树的总结来决定。
2、实例
import numpy as np from sklearn.preprocessing import Imputer imp = Imputer(missing_values='NaN', strategy='mean', axis=0) import numpy as np from sklearn.preprocessing import Imputer ###1.使用均值填充缺失值 imp = Imputer(missing_values='NaN', strategy='mean', axis=0) imp.fit([[1, 2], [np.nan, 3], [7, 6]]) X = [[np.nan, 2], [6, np.nan], [7, 6]] print(imp.transform(X)) [[4. 2. ] [6. 3.66666667] [7. 6. ]]
以上就是python缺失值的解决方法,希望对大家有所帮助。
相关教程
-
Python 隐藏输入密码时屏幕回显的实例
今天小编就为大家分享一篇Python 隐藏输入密码时屏幕回显的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
发布时间:2019-06-03
-
python实现合并两个排序的链表
这篇文章主要为大家详细介绍了python实现合并两个排序的链表,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
发布时间:2019-06-03