《数据挖掘:实用案例分析》是数据挖掘实战领域颇具特色的一部作品,作者曾为10余个行业上百家大型企业提供数据挖掘服务,本书是其在数据挖掘领域探索近10年的经验总结之作。全书以实践和实用为宗旨,深度与广度兼顾,实践与理论并举。
《数据挖掘:实用案例分析》共12章,分三个一部分。第一部分是基本篇(第一~4章),关键对数据挖掘的基本要素、运用归类、建模方式及常见的建模专用工具开展了介绍,并对这书常用到的数据挖掘建模服务平台TipDM开展了表明。第二一部分是实战篇(第五~10章),以实例的方式对数据挖掘技术性在金融业、电信网、电力工程、互联网技术、生产加工及其公共文化服务等制造行业的应用领域开展了探讨;最先介绍实例情况,随后论述统计分析方法与过程,最终进行实体模型搭建;在介绍建模过程的另外交叉实际操作训炼,把有关的知识要点置入相对的实际操作过程中;除此之外,第10章精心策划了六个试验新项目,读者能够 根据这章介绍的方式动手能力实践活动,以推进数据挖掘专业知识,在剖析建模过程的另外,进一步提高自学能力。第三一部分是高級篇(第11~12章),关键介绍根据第三方接口的数据挖掘二次开发技术性,重中之重对常见的WEKA和MATLAB数据挖掘优化算法插口开展了讨论;最终对根据Hadoop架构的大量数据挖掘开展了表明,以考虑读者更高层次人才的要求。
目录
- 前 言
- 第一部分 基 础 篇
- 第1章 初识数据挖掘
- 1.1 什么是数据挖掘
- 1.2 数据挖掘在企业商务智能应用中的定位
- 1.2.1 数据挖掘给企业带来最大的投资收益
- 1.2.2 数据挖掘从本质上提升商务智能平台的价值
- 1.2.3 数据挖掘让商务智能流程真正形成闭环
- 1.3 信息类BI应用与知识类BI应用
- 1.4 数据挖掘现状及应用前景
- 1.5 本章小结
- 第2章 数据挖掘的应用分类
- 2.1 分类与回归
- 2.1.1 分类与回归建模原理
- 2.1.2 分类与回归算法
- 2.2 聚类
- 2.2.1 聚类分析建模原理
- 2.2.2 聚类算法
- 2.3 关联规则
- 2.3.1 什么是关联规则
- 2.3.2 关联规则算法
- 2.4 时序模式
- 2.4.1 什么是时序模式
- 2.4.2 时间序列的组合成分
- 2.4.3 时间序列的组合模型
- 2.4.4 时序算法
- 2.5 偏差检测
- 2.6 本章小结
- 第3章 数据挖掘建模
- 3.1 数据挖掘的过程
- 3.2 数据挖掘建模过程
- 3.2.1 定义挖掘目标
- 3.2.2 数据取样
- 3.2.3 数据探索
- 3.2.4 预处理
- 3.2.5 模式发现
- 3.2.6 模型构建
- 3.2.7 模型评价
- 3.3 常用的建模工具
- 3.4 本章小结
- 第4章 顶尖数据挖掘平台TipDM
- 4.1 TipDM产品功能
- 4.1.1 TipDM平台提供的数据探索及预处理算法
- 4.1.2 TipDM平台提供的分类与回归算法
- 4.1.3 TipDM平台提供的时序模式算法
- 4.1.4 TipDM平台提供的聚类分析算法
- 4.1.5 TipDM平台提供的关联规则算法
- 4.2 TipDM使用说明
- 4.3 TipDM产品特点
- 4.3.1 支持CRISP-DM数据挖掘标准流程
- 4.3.2 提供丰富的数据挖掘模型和灵活算法
- 4.3.3 具有多模型的整合能力
- 4.3.4 提供灵活多样的应用开发接口
- 4.3.5 海量数据的处理能力
- 4.3.6 适应不同类型层次人员需求
- 4.4 本章小结
- 第二部分 实 战 篇
- 第5章 数据挖掘在金融电信行业的应用
- 5.1 案例一:基于公司价值评价的证券策略投资
- 5.1.1 挖掘目标的提出
- 5.1.2 分析方法与过程
- 5.1.3 建模仿真
- 5.1.4 核心知识点
- 5.1.5 拓展思考
- 5.2 案例二:电信3G客户识别系统
- 5.2.1 挖掘目标的提出
- 5.2.2 分析方法与过程
- 5.2.3 建模仿真
- 5.2.4 核心知识点
- 5.2.5 拓展思考
- 5.3 案例三:基于客户分群的精准智能营销
- 5.3.1 挖掘目标的提出
- 5.3.2 分析方法与过程
- 5.3.3 建模仿真
- 5.3.4 核心知识点
- 5.3.5 拓展思考
- 5.4 本章小结
- 第6章 数据挖掘在电力行业的应用
- 6.1 案例一:电力负荷预测
- 6.1.1 挖掘目标的提出
- 6.1.2 分析方法与过程
- 6.1.3 建模仿真
- 6.1.4 核心知识点
- 6.1.5 拓展思考
- 6.2 案例二:自适应防窃漏电实时诊断
- 6.2.1 挖掘目标的提出
- 6.2.2 分析方法与过程
- 6.2.3 建模仿真
- 6.2.4 核心知识点
- 6.2.5 扩展思考
- 6.3 本章小结
- 第7章 数据挖掘在互联网行业的应用
- 7.1 案例一:商业零售行业中的购物篮分析
- 7.1.1 挖掘目标的提出
- 7.1.2 分析方法与过程
- 7.1.3 建模仿真
- 7.1.4 核心知识点
- 7.1.5 拓展思考
- 7.2 案例二:电子商务网站用户行为分析
- 7.2.1 挖掘目标的提出
- 7.2.2 分析方法与过程
- 7.2.3 建模仿真
- 7.2.4 核心知识点
- 7.2.5 拓展思考
- 7.3 案例三:网络入侵智能检测
- 7.3.1 挖掘目标的提出
- 7.3.2 分析方法与过程
- 7.3.3 建模仿真
- 7.3.4 核心知识点
- 7.3.5 拓展思考
- 7.4 案例四:基于用户行为分析的定向网络广告投放
- 7.4.1 挖掘目标的提出
- 7.4.2 分析方法与过程
- 7.4.3 建模仿真
- 7.4.4 结果及分析
- 7.4.5 核心知识点
- 7.4.6 拓展思考
- 7.5 案例五:企业信息系统用户服务感知评价
- 7.5.1 挖掘目标的提出
- 7.5.2 分析方法与过程
- 7.5.3 建模仿真
- 7.5.4 核心知识点
- 7.5.5 拓展思考
- 7.6 本章小结
- 第8章 数据挖掘在生产制造行业中的应用
- 8.1 案例一:基于小波变换的桩基完整性检测
- 8.1.1 挖掘目标的提出
- 8.1.2 分析方法与过程
- 8.1.3 仿真过程
- 8.1.4 核心知识点
- 8.1.5 拓展思考
- 8.2 案例二:基于水色图像的水质评价
- 8.2.1 挖掘目标的提出
- 8.2.2 分析方法与过程
- 8.2.3 建模仿真
- 8.2.4 核心知识点
- 8.2.5 拓展思考
- 8.3 案例三:生物质废物混合厌氧消化优势组分互补机制
- 8.3.1 挖掘目标的提出
- 8.3.2 分析方法与过程
- 8.3.3 建模仿真
- 8.3.4 核心知识点
- 8.3.5 拓展思考
- 8.4 案例四:基于RFM的企业客户关系分析
- 8.4.1 挖掘目标的提出
- 8.4.2 分析过程与方法
- 8.4.3 建模仿真
- 8.4.4 核心知识点
- 8.4.5 拓展思考
- 8.5 案例五:水产养殖投入产出多目标优化仿真
- 8.5.1 挖掘目标的提出
- 8.5.2 分析方法与过程
- 8.5.3 建模仿真
- 8.5.4 核心知识点
- 8.5.5 拓展思考
- 8.6 本章小结
- 第9章 数据挖掘在公共服务行业的应用
- 9.1 案例一:乳腺癌证素变化规律及截断疗法
- 9.1.1 挖掘目标的提出
- 9.1.2 分析方法与过程
- 9.1.3 建模仿真
- 9.1.4 核心知识点
- 9.1.5 拓展思考
- 9.2 案例二:卷烟消费者购买行为分析
- 9.2.1 挖掘目标的提出
- 9.2.2 分析过程与方法
- 9.2.3 挖掘建模
- 9.2.4 核心知识点
- 9.2.5 拓展思考
- 9.3 案例三:纳税人偷漏税评估
- 9.3.1 挖掘目标的提出
- 9.3.2 分析方法与过程
- 9.3.3 建模仿真
- 9.3.4 核心知识点
- 9.3.5 拓展思考
- 9.4 案例四:道路缺陷自动识别
- 9.4.1 挖掘目标的提出
- 9.4.2 分析方法与过程
- 9.4.3 建模仿真
- 9.4.4 核心知识点
- 9.4.5 拓展思考
- 9.5 案例五:航空公司客运信息挖掘
- 9.5.1 挖掘目标的提出
- 9.5.2 分析方法与过程
- 9.5.3 建模仿真
- 9.5.4 核心知识点
- 9.5.5 拓展思考
- 9.6 本章小结
- 第10章 动手实践
- 10.1 实验一:数据探索及数据预处理
- 10.2 实验二:神经网络模型的构建与使用
- 10.3 实验三:决策树模型的构建与使用
- 10.4 实验四:聚类算法的构建与使用
- 10.5 实验五:关联规则模型的构建与使用
- 10.6 实验六:时间序列模型的构建与使用
- 10.7 本章小结
- 第三部分 高 级 篇
- 第11章 基于第三方接口的数据挖掘二次开发
- 11.1 WEKA数据挖掘接口
- 11.1.1 WEKA功能及其算法
- 11.1.2 WEKA包结构
- 11.1.3 WEKA算法入口
- 11.1.4 二次开发相关输出
- 11.2 MATLAB数据挖掘接口
- 11.3 案例:基于MATLAB接口的数据挖掘二次开发
- 11.3.1 接口算法编程
- 11.3.2 用Java Builder创建Java组件
- 11.3.3 安装MATLAB运行时环境
- 11.3.4 JDK环境及设置
- 11.4 本章小结
- 第12章 基于Hadoop框架的海量数据挖掘开发
- 12.1 基于云计算的海量数据挖掘技术特点
- 12.2 基于Hadoop的并行数据挖掘算法工具箱TipCDM
- 12.3 案例:基于海量计量数据的电力客户在线分群方法
- 12.3.1 挖掘目标的提出
- 12.3.2 分析方法与过程
- 12.3.3 建模仿真
- 12.3.4 核心知识点
- 12.4 本章小结
- 参考文献