实战大数据
作者:鲍亮,李倩 编著
“数据是重要资产”已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。《实战大数据》在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。《实战大数据》共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例。《实战大数据》适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高等院校相关专业师生的教学参考书。
目录
- 第一篇 大数据基础篇
- 第1章 大数据介绍
- 1.1 大数据相关概念
- 1.1.1 大数据的历史
- 1.1.2 大数据的定义
- 1.2 大数据研究内容
- 1.3 人数据研究现状
- 1.3.1 学术界现状
- 1.3.2 产业界现状
- 1.3.3 政府机构现状
- 1.4 大数据的应用领域
- 1.4.1 大数据在制造业的应用
- 1.4.2 大数据在服务业的应用
- 1.4.3 大数据在交通行业的应用
- 1.4.4 大数据在医疗行业的应用
- 1.5 本章小结
- 第2章 数据存储技术
- 2.1 数据存储技术介绍
- 2.2 数据采集与存储技术研究现状
- 2.2.1 传统关系型数据库
- 2.2.2 新兴数据存储系统
- 2.3 海量数据存储的关键技术分析
- 2.3.1 数据划分
- 2.3.2 数据一致性与可用性
- 2.3.3 负载均衡
- 2.3.4 容错机制
- 2.3.5 海量数据存储的硬件支持
- 2.4 数据存储技术的实现与工具
- 2.4.1 集中式数据存储管理系统Bigtable
- 2.4.2 非集中式的大规模数据管理系统Dynamo
- 2.4.3 BigTable的开源实现HBase
- 2.4.4 MongoDB
- 2.4.5 CouchDB
- 2.4.6 Redis
- 2.4.7 Hypertabie
- 2.4.8 其他开源NoSQL数据库
- 2.5 本章小结
- 第3章 数据抽取和清洗
- 3.1 数据抽取和清洗技术介绍
- 3.1.1 数据抽取简介
- 3.1.2 数据清洗简介
- 3.2 数据抽取和清洗研究现状
- 3.3 数据抽取技术的实现
- 3.3.1 Web数据抽取
- 3.3.2 非结构化数据抽取
- 3.3.3 基于云计算的海量数据分析
- 3.4 数据清洗技术的实现
- 3.4.1 数据清洗流程
- 3.4.2 数据清洗框架
- 3.4.3 数据清洗相关技术
- 3.4.4 基天Hadoop的数据清洗方案
- ……
- 第二篇 大数据深入篇
-
第三篇 大数据应用篇