数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。
clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。作者基于长期从事计算机数据分析教学与科研工作的经验编写了本书,在编写过程中体现出以下特色:·以数据挖掘过程为线索介绍clementine软件。本书以数据挖掘的实践过程为主线,从clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握clementine的基本功能和一般方法,并可迅速运用到实际工作中。
·数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。·数据挖掘方法讲解全面,语言通俗。本书对clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。
目录
- 第1章数据挖掘和clementine使用概述
- 1.1数据挖掘的产生背景
- 1.2什么是数据挖掘
- 1.3clementine软件概述
- 第2章clementine的数据读入和数据集成
- 2.1变量类型
- 2.2读人数据
- 2.3生成实验方案
- 2.4数据集成
- 第3章clementine的数据理解
- 3.1变量说明
- 3.2数据质量的评估和调整
- 3.3数据的排序
- 3.4数据的分类汇总
- 3.5用户报表
- 第4章clementine的数据准备
- 4.1变量变换
- 4.2变量派生
- 4.3数据精简
- 4.4数据筛选
- 4.5数据准备的其他工作
- 第5章clementine的基本分析
- 5.1数值型变量的基本分析
- 5.2两分类型变量相关性的研究
- 5.3两总体的均值比较
- 5.4rfm分析
- 第6章clementine的数据精简
- 6.1变量值的离散化处理
- 6.2特征选择
- 6.3因子分析
- 第7章分类预测:clementine的决策树
- 7.1决策树算法概述
- 7.2clementine的c5.0算法及应用
- 7.3clementine的分类回归树及应用
- 7.4clementine的chaid算法及应用
- 7.5clementine的quest算法及应用
- 7.6模型的对比分析
- 第8章分类预测:clementine的人工神经网络
- 8.1人工神经网络算法概述
- 8.2clementine的b-p反向传播网络
- 8.3clementine的b-p反向传播网络的应用
- 8.4clementine的径向基函数网络及应用
- 第9章分类预测:clementine的支持向量机
- 9.1支持向量分类的基本思路
- 9.2支持向量分类的基本原理
- 9.3支持向量回归
- 9.4支持向量机的应用
- 第10章分类预测:clementine的logistic回归分析
- 10.1logistic回归分析概述
- 10.2二项logistic回归分析
- 10.3二项logistic回归分析的应用
- 10.4多项logistic回归分析及应用
- 第11章分类预测:clementine的判别分析
- 11.1距离判别法
- 11.2fisher判别法
- 11.3贝叶斯判别法
- 11.4判别分析的应用
- 第12章分类预测:clementine的贝叶斯网络
- 12.1贝叶斯方法基础
- 12.2贝叶斯网络概述
- 12.3tan贝叶斯网络
- 12.4马尔科夫毯网络
- 12.5贝叶斯网络的应用
- 第13章探索内部结构:clementine的聚类分析
- 13.1聚类分析的一般问题
- 13.2clementine的k-means聚类及应用
- 13.3clementine的两步聚类及应用
- 13.4clementine的kohonen网络聚类及应用
- 13.5基于聚类分析的离群点探索
- 第14章探索内部结构:clementine的关联分析
- 14.1简单关联规则及其有效性
- 14.2clementine的apriori算法及应用
- 14.3clementine的gri算法及应用
- 14.4clementine的序列关联及应用
- 参考文献