这是公认的、权威的适合教学和零基础自学的R语言与数据挖掘教程,华南师范大学、广东工业大学、广西科技大学等20余所大学选为教材。即便你完全没有R语言编程基础和数据挖掘基础,根据本书中的理论知识和上机实践,你也能迅速掌握如何使用R语言进行数据挖掘。本书已经被多少高校预定为教材,为了便于教学,书中还提供了大量的上机实验和教学资源。
《R语言与数据挖掘》主要分为三个部分:
基础篇(1~5章),主要包括R语言及图形操作工具RStudio的安装及使用方法、数据类型和数据对象、数据预处理的常用操作(包括数据重命名、缺失值分析、排序、*抽样等)、绘图功能(包括散点图、直方图、条形图、箱线图等)。
建模应用篇(6~10章),主要对数据挖掘中的常用算法的函数在R语言中的使用方法及其结果解释进行了介绍。涵盖了目前数据挖掘的5大类算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式。按照模型建立至模型评价的架构进行介绍,使读者能熟练的掌握从建模到对模型评价的完整建模过程。
Rattle篇(11章),此工具能够在一个图形化的界面上对本书所介绍的R语言功能进行操作,使读者能更好的体验到使用R语言进行数据挖掘的整个流程。
书中配套提供了原始样本数据文件及对应章节示例代码。每个章节有对应的练习实验和教学PPT,读者可通过完成对应的练习,迅速掌握R语言的用法和数据挖掘的方法。
目录
- 第一部分 基础篇
- 第1章 R语言的安装与使用 2
- 第2章 数据对象与数据读写 12
- 第3章 R语言常用数据管理 42
- 第4章 图形探索 75
- 第5章 高级绘图工具 117
- 第二部分 建模应用篇
- 第6章 分类与预测 166
- 第7章 聚类分析 198
- 第8章 关联规则 213
- 第9章 智能推荐 228
- 第10章 时间序列 237
- 第三部分 Rattle篇
- 第11章 可视化数据挖掘工具Rattle 254