《数据挖掘原理算法与应用》系统介绍了数据挖掘原理、算法和应用的相关知识。主要内容包括数据挖掘的过程、数据存储技术、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据类型的数据挖掘技术。本书涵盖了数据挖掘过程的各方面技术和算法,在内容安排上将理论知识和工程技术应用有机地结合起来,并介绍了许多数据挖掘的典型应用方法。本书可作为高等院校计算机科学与技术、信息管理、数据分析等专业的教科书,也可作为企业管理、信息分析人员的技术参考书。
目录
- 出版说明
- 前言
- 第1章 概述
- 1.1 从数据中获取知识
- 1.2 数据挖掘的基本概念
- 1.3 数据挖掘的发展历程
- 1.4 数据挖掘的功能和数据挖掘系统的分类
- 1.4.1 分类与回归
- 1.4.2 聚类分析
- 1.4.3 关联规则
- 1.4.4 时序模式
- 1.4.5 异常检测
- 1.4.6 数据挖掘系统的分类
- 1.5 数据挖掘的过程
- 1.5.1 数据挖掘的一般流程
- 1.5.2 跨行业数据挖掘标准过程
- 1.6 数据挖掘与其他学科的关系
- 1.6.1 数据挖掘与数据库知识发现
- 1.6.2 数据挖掘与数据库查询
- 1.6.3 数据挖掘与统计分析
- 1.6.4 数据挖掘与数据仓库
- 1.6.5 数据挖掘与联机分析处理
- 1.6.6 数据挖掘与人工智能、专家系统、机器学习
- 1.7 数据挖掘的应用和发展趋势
- 1.7.1 商业的数据挖掘
- 1.7.2 金融业的数据挖掘
- 1.7.3 欺诈侦测中的数据挖掘
- 1.7.4 DNA数据分析中的数据挖掘
- 1.7.5 电信业中的数据挖掘
- 1.7.6 科学和统计数据挖掘
- 1.7.7 数据挖掘系统和软件
- 1.7.8 数据挖掘的发展趋势
- 1.8 小结
- 1.9 习题
- 第2章 数据存储
- 2.1 关系数据集
- 2.2 数据仓库
- 2.2.1 数据仓库的概念和特点
- 2.2.2 数据仓库的数据组织
- 2.2.3 数据仓库的关键技术
- 2.2.4 数据仓库与数据挖掘的关系
- 2.3 NoSQL数据库
- 2.3.1 NoSQL概念与理论
- 2.3.2 NoSQL数据模型
- 2.3.3 NoSQL与关系数据库
- 2.4 分布式文件系统
- 2.4.1 分布式文件系统的历史
- 2.4.2 分布式文件系统的体系结构
- 2.4.3 谷歌文件系统(GoogleFS)
- 2.4.4 Hadoop分布式文件系统(HDFS)
- 2.5 小结
- 2.6 习题
- 第3章 数据预处理
- 3.1 数据预处理的必要性
- 3.2 数据清理
- 3.2.1 缺失数据处理方法
- 3.2.2 噪声数据平滑技术
- 3.2.3 时间相关数据的处理
- 3.3 数据集成
- 3.3.1 实体识别与匹配
- 3.3.2 冗余和相关分析
- 3.3.3 元组重复数据的检测
- 3.3.4 冲突数据的检测与处理
- 3.4 数据转换
- 3.4.1 数据标准化
- ……
- 第4章 数据相似度与异常检测
- 第5章 数据分类和预测
- 第6章 数据聚类分析
- 第7章 数据关联分析
- 第8章 性能评估和提升
- 第9章 复杂数据挖掘
- 参考文献