《大数据预处理:基于Python的应用》是由首都经济贸易大学出版社出版的一本关于大数据预处理方面的书籍,作者是任韬,主要介绍了关于大数据、Python方面的知识内容,目前在大数据预处理类书籍综合评分为:7.4分。
书籍介绍
数据预处理的目的是在进行数据分析前,通过技术手段解决集中存在的数据质量问题,并进一步提升数据信息含量的。本书主要围绕着“什么是数据预处理、数据预处理的作用是什么、如何进行数据预处理”展开,主要内容包括缺失值处理、数据纠错、数据格式转化、低频分类数据处理、高偏度数据处理、异常值处理、数据配平、数据特征缩放、数据归约等。通过本书的学习,读者可以充分理解常用数据预处理方法的精髓,并掌握具体技术细节,为数据分析实践打下扎实基础。本书可作为统计学、数据科学与大数据技术、计算机相关专业等本科专业和统计学、应用统计学等专业研究生的教材或教学参考用书。