《数据挖掘理论与实例》是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。《数据挖掘理论与实例》的主要目标是,通过不同领域的应用案例来说明数据挖掘在实际应用中的具体操作方法。将数据库管理系统MySQL和统计软件R结合,利用数据挖掘技术帮助陷入海量数据中的组织和个人提取有用的信息。《数据挖掘理论与实例》的主要内容包括理论和实例两部分:第一、第二章介绍数据挖掘、数据仓库和数据挖掘的常用技术等基本理论;实例部分是以作者的两个研究课题为基础,第三、第四章介绍呼叫中心数据仓库的构建和数据挖掘模型与实现(MSSQLServer2000、决策树);第五、第六章介绍数据挖掘在QFII投资理念与持股偏好研究中的应用(Rsoft-ware、MySQL、多元逐步线性回归、因子分析、聚类分析等)。
目录
- 第一章 绪论
- 第一节 什么是数据挖掘
- 第二节 基本数据挖掘任务
- 第三节 数据挖掘的过程
- 第四节 数据仓库与OLAP技术概述
- 第五节 数据挖掘技术的发展
- 第二章 数据挖掘工具
- 第一节 数据挖掘的统计方法
- 第二节 聚类分析
- 第三节 决策树
- 第四节 相关软件
- 第三章 呼叫中心中数据仓库的构建
- 第一节 数据仓库构建的实施方法及步骤
- 第二节 呼叫中心数据仓库模型设计
- 第三节 数据仓库生成
- 第四章 呼叫中心中的数据挖掘模型与实现
- 第一节 问题鉴别
- 第二节 解决方案
- 第三节 基于决策树的分类算法模型
- 第四节 C4.5算法构造信息需求分类和客户细分决策树实例
- 第五节 功能模块的实现
- 第六节 系统应用示例
- 第五章 QFII投资理念与持股偏好研究中数据收集与整理
- 第一节 外国机构投资者投资理念及持股偏好概述
- 第二节 QFII重仓股数据来源
- 第三节 因变量的选取
- 第四节 自变量的选取
- 第六章 QFII投资理念与持股偏好研究中数据挖掘模型与实现
- 第一节 重仓股家数变化趋势和行业分布
- 第二节 重仓股持有时间特征
- 第三节 描述性统计分析
- 第四节 相关性分析
- 第五节 持股偏好多元线性逐步回归分析
- 参考文献
- 附表
- 附表1 12家QFII基本情况及最新额度
- 附表2 瑞士银行的名称
- 附表3 12家QFII持有股票家数和行业情况汇总
- 附表4 各季度因变量和自变量的均值及样本个数
- 附表5 各季度因变量和自变量的方差及样本个数
- 附表6 2008年12月31日Y对上一个季度所有
- 自变量线性相关系数
- 附表7Y对上一个季度、本季度及未来一个季度的
- 所有自变量X逐步回归模型系数情况
- 附表8两种方式回归结果对比
- 附录
- 附录一 数据仓库中的数据表架构
- 附录二 数据仓库关系图
- 附录三 QFII重仓股数据的获取过程
- 附录四 自变量数据的获得及缺失值处理
- 附录五 模型建立一数据分析过程
- 特别提示:本资源需要会员组权限,普通注册用户无法下载.