数据仓库与数据挖掘技术
作者: 孙水华,赵钊林,刘建华 著
出版时间: 2012
丛编项: 高等院校信息管理与信息系统专业系列教材
《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》共分为9章,主要包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》各章节的案例均使用microsoftsqlserver2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。
目录
- 第1章 数据仓库与数据挖掘概述
- 1.1数据仓库的产生与发展
- 1.1.1数据仓库的产生
- 1.1.2数据仓库的发展
- 1.1.3数据仓库的研究与开发现状
- 1.1.4数据仓库的作用
- 1.2数据仓库的基本概念
- 1.2.1数据仓库的定义与基本特性
- 1.2.2数据仓库与数据库的区别
- 1.2.3数据仓库数据的组织架构
- 1.3数据仓库的体系结构
- 1.3.1虚拟的数据仓库体系结构
- 1.3.2单独的数据仓库体系结构
- 1.3.3单独的数据集市体系结构
- 1.3.4分布式数据仓库结构
- 1.4数据仓库的相关概念
- 1.4.1数据源
- 1.4.2数据的存储层
- 1.4.3olap服务器
- 1.4.4前端工具
- 1.5数据挖掘技术概述
- 1.5.1数据挖掘技术产生的背景
- 1.5.2数据挖掘的基本概念
- 1.5.3数据挖掘的对象
- 1.5.4数据挖掘功能
- 1.5.5数据挖掘与传统分析方法的区别
- 1.5.6数据仓库与数据挖掘的关系
- 1.5.7数据挖掘的发展趋势
- 1.6数据挖掘过程
- 1.6.1fayyad过程模型
- 1.6.2crisp-dm过程模型
- 1.6.3其他数据挖掘过程模型
- 1.7常用的数据挖掘技术
- 1.8小结
- 1.9习题
- 第2章 数据仓库开发模型
- 2.1数据仓库开发模型概述
- 2.2数据仓库的概念模型
- 2.2.1企业模型的建立
- 2.2.2规范的数据模型
- 2.2.3常见的概念模型
- 2.3数据仓库的逻辑模型
- 2.3.1事实表模型设计
- 2.3.2维度表模型设计
- 2.4数据仓库的物理模型
- 2.4.1物理模型的设计要点
- 2.4.2数据仓库物理模型的存储结构
- 2.4.3数据仓库物理模型的索引构建
- 2.4.4数据仓库物理模型的优化问题
- 2.5数据仓库的元数据模型
- 2.5.1元数据的类型
- 2.5.2元数据的作用
- 2.5.3元数据的收集与维护
- 2.5.4元数据的使用
- 2.5.5元数据管理模型
- 2.6数据仓库的粒度和聚集模型
- 2.6.1数据仓库粒度模型
- 2.6.2数据仓库聚集模型与数据分割
- 2.7小结
- 2.8习题
- 第3章 etl技术
- 3.1etl相关概念
- 3.1.1数据理解
- 3.1.2数据抽取
- 3.1.3数据清洗
- 3.1.4数据转换
- 3.1.5数据加载
- 3.2etl过程建模
- 3.2.1etl系统面临的挑战
- 3.2.2etl过程描述
- 3.2.3etl概念模型
- 3.2.4etl逻辑模型
- 3.3etl增量抽取机制
- 3.4etl过程数据质量控制
- 3.4.1数据质量问题分类
- 3.4.2数据质量控制技术
- 3.5etl并行处理技术
- 3.6小结
- 3.7习题
- 第4章 olap技术
- 4.1olap概述
- 4.1.1olap的定义
- 4.1.2数据仓库与数据分析的关系
- 4.1.3多维分析的基本概念
- 4.1.4olap的多维数据分析
- 4.1.5olap与oltp的比较
- 4.2多维数据库及其存储
- 4.2.1多维数据库
- 4.2.2多维数据库的数据存储
- 4.2.3多维数据库与数据仓库
- 4.3olap的类型
- 4.3.1多维olap
- 4.3.2关系olap
- 4.3.3混合型olap
- 4.3.4molap与rolap的比较
- 4.4olap的体系结构
- 4.5olap中的索引技术
- 4.5.1b-tree索引
- 4.5.2位图索引
- 4.5.3位图索引的扩展--标识符索引
- 4.5.4索引性能比较
- 4.5.5索引的选择
- 4.6olap的评价标准
- 4.6.1olap的衡量标准
- 4.6.2olap服务器和工具的评价标准
- 4.7olap的前端展现
- 4.7.1olap工具
- 4.7.2olap结果的展现方法
- 4.8小结
- 4.9习题
- 第5章 商务智能系统
- 5.1商务智能概述
- 5.1.1商务智能的概念
- 5.1.2商务智能的发展历程
- 5.1.3商务智能的商业效益
- 5.2商务智能系统架构
- 5.2.1商务智能系统的核心技术
- 5.2.1商务智能的体系结构
- 5.3商务智能系统的功能
- 5.4商务智能系统的应用
- 5.4.1商务智能系统特点
- 5.4.2我国商务智能系统应用现状分析
- 5.5小结
- 5.6习题
- 第6章 数据预处理技术
- 6.1数据预处理概述
- 6.1.1数据预处理的必要性
- 6.1.2数据预处理的基本方法
- 6.1.3数据预处理的研究现状
- 6.2数据清理
- 6.2.1填充缺失值
- 6.2.2光滑噪声数据
- 6.2.3数据清理过程
- 6.3数据集成
- 6.4数据变换
- 6.5数据归约
- 6.5.1数据立方体聚集
- 6.5.2属性子集选择
- 6.5.3维度归约
- 6.5.4数值归约
- 6.5.5数据离散化与概念分层
- 6.6小结
- 6.7习题
- 第7章 数据挖掘技术
- 7.1概念描述
- 7.1.1概念描述的生成过程
- 7.1.2概念分层与数据泛化
- 7.1.3概念分层方法
- 7.1.4数据泛化方法
- 7.1.5泛化的表示
- 7.1.6属性相关分析
- 7.1.7区别性描述
- 7.2关联规则
- 7.2.1关联规则相关概念
- 7.2.2关联规则挖掘步骤
- 7.2.3关联规则分类
- 7.2.4关联规则的算法
- 7.3数据分类
- 7.3.1数据分类的基本步骤与评价准则
- 7.3.2决策树
- 7.3.3贝叶斯分类
- 7.3.4神经网络方法
- 7.3.5近邻分类方法
- 7.4数据聚类
- 7.4.1聚类分析概述
- 7.4.2聚类算法的分类及其典型算法
- 7.4.3聚类分析中的相似度度量方法
- 7.4.4聚类分析中的聚类准则函数
- 7.4.5k-means聚类算法
- 7.5遗传算法
- 7.5.1遗传算法的基本术语
- 7.5.2遗传算法的执行过程
- 7.5.3遗传算法应用举例
- 7.5.4遗传算法的基本要素
- 7.5.5遗传算法的特点及应用领域
- 7.6粗糙集
- 7.6.1粗糙集理论的相关概念
- 7.6.2粗糙集的应用举例
- 7.6.3粗糙集理论研究的对象及特点
- 7.7小结
- 7.8习题
- 第8章 数据仓库开发实例
- 8.1sql server 2005所提供的数据仓库功能
- 8.1.1sql server 2005 integration services
- 8.1.2sql server 2005 analysis services
- 8.1.3sql server 2005 dw工具
- 8.2福马特商店销售分析数据仓库系统的分析与设计
- 8.3数据仓库的实现
- 8.3.1sql server的数据仓库创建
- 8.3.2olap的实施
- 8.3.3数据仓库中的数据挖掘
- 8.4数据仓库的应用与管理
- 8.4.1数据仓库的用户
- 8.4.2数据仓库应用案例
- 8.4.3数据仓库的运行技术管理
- 8.4.4数据仓库应用中的法律问题
- 8.4.5数据仓库的成本与效益分析
- 8.5小结
- 8.6习题
- 第9章 报表设计
- 9.1报表概述
- 9.1.1报表结构
- 9.1.2传递报表
- 9.1.3report server功能结构
- 9.1.4report services的组成部分
- 9.2报表向导制作报表
- 9.2.1向导制作报表
- 9.2.2报表设计器
- 9.2.3部署报表
- 9.3编辑制作报表
- 9.3.1新建报表项目
- 9.3.2新建数据集
- 9.3.3报表格式设计
- 9.3.4分组
- 9.3.5钻取功能
- 9.3.6文档结构图
- 9.4矩阵式报表
- 9.4.1数据集建立
- 9.4.2矩阵布局
- 9.4.3矩形布局
- 9.4.4折叠结构
- 9.5统计图表
- 9.5.1图表元素
- 9.5.2柱形图
- 9.5.3折线图
- 9.5.4饼图
- 9.5.5圆环图
- 9.6主体的多列
- 9.7小结
- 9.8实验
- 参考文献