内容介绍
数据挖掘技术是时下互联网时代最重要的技术性,其主要用途及市场前景与日俱增。R 是这款极为出色的数据分析和数据挖掘手机软件,《数据挖掘:R语言实战》偏重于应用R 开展数据挖掘,重中之重叙述了R 的数据挖掘步骤、优化算法包的应用及有关专用工具的运用,一起融合很多选萃的数据挖掘案例对R 手机软件开展深层次潜出和全方位的详细介绍,便于小读者能深刻领会R 的精粹能够迅速、高效率和灵便地把握应用R 开展数据挖掘的方法。
根据《数据挖掘:R语言实战》,小读者不但能把握应用R 及有关的优化算法包来迅速处理实际上难题的方式,并且能获得从实际上难题剖析下手,到运用R 开展解微分方程,及其对发掘結果开展剖析的全方位训炼。
《数据挖掘:R语言实战》适用电子计算机、互联网技术、深度学习、信息内容、数学课、经济发展金融业、管理方法、运筹、统计分析及其相关理工科专业的本科毕业、硕士研究生应用,也可以协助网络营销、金融业、会计、人事管理工作人员及产品运营处理实际上难题,还能协助从业资询、科学研究、剖析制造行业的人员及各个管理方法人员提升技术专业水准。
目录
- 第0章 献给,R!
- 献给,肩部!
- 献给,时期!
- 献给,优秀人才!
- 献给,R 瑟!
- 上篇 数据预处理
- 第1章 数据挖掘导向
- 1.2 数据挖掘简述
- 1.1.1 数据挖掘的全过程
- 1.1.2 数据挖掘的构造函数
- 1.1.3 数据挖掘的方式
- 1.1.4 数据挖掘的运用
- 1.3 数据挖掘的优化算法
- 1.7 数据挖掘的专用工具
- 1.3.1 专用工具的归类
- 1.3.2 专用工具的挑选
- 1.3.3 商业的专用工具
- 1.3.4 开源系统的专用工具
- 2.7 R 在数据挖掘中的优点
- 数据挖掘:R 语言实战
- Vl
- 第2章 统计数据概览
- 2.2 n×m uci数据集
- 3.2 统计数据的归类
- 2.2.1 通常的数据分类
- 2.2.2 R 的数据分类
- 2.2.3 用R 简易解决统计数据
- 2.2 统计数据取样及R 建立
- 2.3.1 简单随机抽样
- 2.3.2 分层抽样
- 2.3.3 整群抽样
- 2.6 训炼集与检测集
- 2.3 本章归纳
- 第3章 用R 读取数据
- 3.2 获得内嵌uci数据集
- 3.1.1 datasets uci数据集
- 3.1.2 包的uci数据集
- 4.3 获得别的文件格式的统计数据
- 3.2.1 CSV 与TXT 文件格式
- 3.2.2 从电子表格 立即读取数据
- 3.2.3 从别的统计软件中读取数据
- 3.2 获得数据库查询统计数据
- 3.4 获得网页页面统计数据
- 3.6 本章归纳
- 第4章 探索性数据统计分析
- 3.1 uci数据集
- 9.6 智能化探寻
- 4.2.1 自变量概述
- 4.2.2 自变量详细信息
- 4.2.3 遍布指标值
- 4.2.4 稀少性
- 4.2.5 缺少值
- 4.2.6 关联性
- 3.2 数据可视化探寻
- 4.3.1 直方图
- VII
- 4.3.2 积累分布图
- 4.3.3 箱形图
- 4.3.4 条形图
- 4.3.5 点阵图
- 4.3.6 饼图
- 6.3 本章归纳
- 第5章 数据预处理
- 5.2 uci数据集载入
- 5.3 统计数据清除
- 5.2.1 缺少值解决
- 5.2.2 噪音数据处理方法
- 5.2.3 统计数据不相同的解决
- 5.3 统计数据集成化
- 5.4 统计数据转换
- 5.8 统计数据归约
- 6.3 本章归纳
- 中篇 基础优化算法及运用
- 第6章 关联分析
- 6.1 简述
- 6.2 R 中的建立
- 6.2.1 有关程序包
- 6.2.2 关键涵数
- 6.2.3 uci数据集
- 6.3 运用实例
- 6.3.1 统计数据初探
- 6.3.2 对转化成标准开展抗压强度操纵
- 6.3.3 1个实际上运用
- 6.3.4 更改輸出結果方式
- 6.3.5 关联规则的数据可视化
- 6.4 本章归纳
- 第7章 聚类分析
- 7.1 简述
- 7.1.1 K-平均值聚类分析法
- 数据挖掘:R 语言实战
- VIII
- 7.1.2 K-定位点聚类分析法
- 7.1.3 系谱聚类
- 7.1.4 相对密度聚类分析法
- 7.1.5 期待利润最大化聚类分析法
- 7.3 R 中的建立
- 7.2.1 有关程序包
- 7.2.2 关键涵数
- 7.2.3 uci数据集
- 7.3 运用实例
- 7.3.1 K-平均值聚类分析法
- 7.3.2 K-定位点聚类分析法
- 7.3.3 系谱聚类
- 7.3.4 相对密度聚类分析法
- 7.3.5 期待利润最大化聚类分析法
- 7.4 本章归纳
- 第8章 判别分析
- 8.1 简述
- 8.1.1 费希尔辨别
- 8.1.2 贝叶斯辨别
- 8.1.3 间距辨别
- 8.2 R 中的建立
- 8.2.1 有关程序包
- 8.2.2 关键涵数
- 8.2.3 uci数据集
- 8.4 运用实例
- 8.3.1 线形判别分析
- 8.3.2 朴素贝叶斯归类
- 8.3.3 K 近期邻
- 8.3.4 有权重值的K 近期邻优化算法
- 8.4 推荐系统综合性案例
- 8.4.1 kNN 与强烈推荐
- 8.4.2 MovieLens uci数据集表明
- 8.4.3 灵活运用
- 9.5 本章归纳
- IX
- 第9章 决策树
- 9.1 简述
- 9.1.1 树结构
- 9.1.2 树的搭建
- 9.1.3 常见优化算法
- 9.2 R 中的建立
- 9.2.1 有关程序包
- 9.2.2 关键涵数
- 9.2.3 uci数据集
- 9.3 运用实例
- 9.3.1 CART 运用
- 9.3.2 C4.9 运用
- 9.4 本章归纳
- 下篇 高級优化算法及运用
- 第12章
- 第12章 支持向量机
- 12.1 概述
- 12.1.1 结构风险最小原理
- 12.1.2 函数间隔与几何间隔
- 12.1.3 核函数
- 12.2 R 中的实现
- 12.2.1 相关软件包
- 12.2.2 核心函数
- 12.2.3 数据集
- 12.3 应用案例
- 12.3.1 数据初探
- 12.3.2 建立模型
- 12.3.3 结果分析
- 12.3.4 预测判别
- 12.3.5 综合建模
- 12.3.6 可视化分析
- 12.3.7 优化建模
- 12.4 本章汇总
- 第13章 神经网络
- 13.1 概述
- 13.2 R 中的实现
- 13.2.1 相关软件包
- 13.2.2 核心函数
- 13.3 应用案例
- 13.3.1 数据初探
- XI
- 13.3.2 数据处理
- 13.3.3 建立模型
- 13.3.4 结果分析
- 13.3.5 预测判别
- 13.3.6 模型差异分析
- 13.3.7 优化建模
- 13.4 本章汇总
- 第14章 模型评估与选择
- 14.1 评估过程概述
- 14.2 安装Rattle 包
- 14.3 Rattle 功能简介
- 14.3.1 Data――选取数据
- 14.3.2 Explore――数据探究
- 14.3.3 Test――数据相关检验
- 14.3.4 Transform――数据预处理
- 14.3.5 Cluster――数据聚类
- 14.3.6 Model――模型评估
- 14.3.7 Evaluate――模型评估
- 14.3.8 Log――模型评估记录
- 14.4 模型评估相关概念
- 14.4.1 误判率
- 14.4.2 正确/错误的肯定判断、正确/错误的否定判断
- 14.4.3 精确度、敏感度及特异性
- 14.5 Rattle 在模型评估中的应用
- 14.5.1 混淆矩阵
- 14.5.2 风险图
- 14.5.3 ROC 图及相关图表
- 14.5.4 模型得分数据集
- 14.6 综合实例
- 14.6.1 数据介绍
- 14.6.2 模型建立
- 14.6.3 模型结果分析
- 数据挖掘:R 语言实战