python数据变换如何实现
- 更新时间:2021-08-03 08:54:26
- 编辑:家霞飞
给网友们整理相关的编程文章,网友余雅诗根据主题投稿了本篇教程内容,涉及到Python相关内容,已被402网友关注,如果对知识点想更进一步了解可以在下方电子资料中获取。
参考资料
- 《Python编程无师自通:专业程序员的养成》配套资源 配套资源 / 380.32 MB / (美)科里·奥尔索夫(Cory Alth 推荐度:
- Python深度学习与项目实战 PDF 电子书 / 58 MB / 周北 推荐度:
- Python数据分析与数据化运营 PDF 电子书 / 31.96 MB / 宋天龙 推荐度:
- 《树莓派Python编程入门与实战(第2版)》配套资源 配套资源 / 34.31 KB / 勃鲁姆,布莱斯纳罕 推荐度:
- Python新手使用Django架站的16堂课 PDF 电子书 / 199.5 MB / 何敏煌 推荐度:
正文内容
无意中在网上看到《python数据变换如何实现》,好东西应该跟大家分享,把网友测试过的内容发布到这里,为了方便大家的阅读。
1、数据规范化,即归一化的方法
常见方法:最小-最大规范化、z-score规范化、小数定标规范化
import pandas as pd df=pd.DataFrame(A.data[:,3:6]) df.columns=A.feature_names[3:6] #最小-最大规范化,支持矢量运算 (df-df.min())/(df.max()-df.min()) #使用sklearn中的preprocessing模块 from sklearn import preprocessing preprocessing.minmax_scale(df) #z-score规范化:结果=(数值-均值)/标准差,处理后数据的均值为0,标准差为1 (df-df.mean())/df.std() #使用sklearn中的preprocessing模块 from sklearn import preprocessing preprocessing.scale(df) #小数定标规范化:常见落在[-1,1]区间,通过移动小数点的位数实现,移动位数取决于属性绝对值的最大值的位数 #ceil向上取整 import numpy as np df/10**np.ceil(np.log10(df.abs().max()))
2、连续属性离散化
常见方法:分箱法(等宽法、等频法)、聚类
import pandas as pd #等宽法,5个箱子,标签为0-4 pd.cut(df.AGE,5,label=range(5)) #等频法 pd.qcut(df.AGE,5,label=range(5))
以上就是python数据变换的实现,希望对大家有所帮助。
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
相关教程
-
Python控制键盘鼠标pynput的详细用法
这篇文章主要介绍了Python控制键盘鼠标pynput的详细用法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
发布时间:2019-06-03
-
Python 爬虫模拟登陆知乎
这篇文章主要介绍了Python 爬虫模拟登陆知乎的相关资料,非常不错,具有参考借鉴价值,需要的朋友可以参考下
发布时间:2019-08-26