《滇西学术文丛:数据挖掘及其应用研究》全面介绍了数据挖掘的背景信息、相关概念及其所使用的主要技术,针对关联规则数据挖掘,系统深入地描述了Apriori算法和FP-growth算法,并比较了各自的优缺点。《滇西学术文丛:数据挖掘及其应用研究》基于关系代数的关联规则挖掘,讨论该算法的实现过程,并对该算法作复杂性分析,在聚类分析数据挖掘、序列模式挖掘等方面也有介绍。对网络入侵检测的拒绝服务攻击类型进行了序列模式挖掘和聚类分析,为进一步开发入侵检测系统提供决策依据,数据挖掘在农作物病虫害预警、居民消费结构分析、多媒体图像挖掘等方面都有应用。
目录
- 第1章 引言
- 1.1 研究背景
- 1.1.1 空间数据挖掘
- 1.1.2 多媒体数据挖掘
- 1.1.3 时序数据挖掘
- 1.1.4 Web数据挖掘
- 1.1.5 不确定数据挖掘
- 1.2 研究内容及意义
- 1.2.1 国内外研究综述
- 1.2.2 关联规则挖掘问题的研究现状与成果
- 1.2.3 研究的意义
- 1.2.4 研究主要内容
- 1.3 数据挖掘概述
- 1.3.1 数据挖掘概念
- 1.3.2 数据挖掘的起源
- 1.3.3 数据挖掘的主要问题
- 1.3.4 数据挖掘的功能
- 1.4 数据挖掘的方法
- 1.5 数据挖掘面临的问题
- 1.5.1 挖掘方法和用户交互问题
- 1.5.2 性能问题
- 1.5.3 关于数据库类型的多样性问题
- 1.6 数据挖掘的发展趋势
- 1.7 研究展望
- 第2章 关联规则数据挖掘
- 2.1 关联规则概述
- 2.2 关联规则的分类
- 2.3 Apriori算法
- 2.3.1 算法描述
- 2.3.2 算法的性能瓶颈
- 2.3.3 算法的优化
- 2.4 FP-growth算法
- 2.4.1 算法描述
- 2.4.2 算法分析
- 第3章 基于关系代数的关联规则挖掘
- 3.1 关系代数的相关概念
- 3.1.1 传统的集合运算
- 3.1.2 专门的关系运算
- 3.2 基于关系代数的Apriori算法
- 3.2.1 算法的基本思想
- 3.2.2 算法分析
- 3.3 发现最大频繁项集和频繁闭项集
- 3.4 仿真实验及结果分析
- 3.4.1 实验环境和实验数据
- 3.4.2 算法性能比较
- 3.4.3 数据样本量对算法的影响
- 3.4.4 支持度对算法的影响
- 3.5 挖掘最大频繁项集和频繁闭项集
- 3.5.1 算法性能分析
- 3.5.2 去除冗余规则
- 第4章 聚类分析数据挖掘
- 4.1 聚类统计量
- 4.1.1 距离
- 4.1.2 匹配系数
- 4.1.3 相似系数
- 4.2 系统聚类法
- 4.2.1 基本思想
- 4.2.2 系统聚类的方法
- 第5章 时间序列和序列模式挖掘
- 第6章 数据挖掘在网络入侵检测中的应用
- 第7章 其他应用研究
- 参考文献
-
后记