深入理解大数据:大数据处理与编程实践在小结很多年来MapReduce并行处理技术课程内容课堂教学工作经验和成效的基本上,与业内知名企业Intel企业的云计算技术和产品研发精英团队和杰出技术工程师协同,以学界的课堂教学成效与业内高质量系统软件产品研发工作经验极致融合,在理论结合的基本上,在基础知识基本原理、具体计算机算法方式及其业内深度技术3个方面上,精心安排原材料撰写而成。
全书的主题思想包含:
■ 大数据处理技术性与Hadoop MapReduce介绍
■ Hadoop系统软件的安裝和实际操作管理方法
■ 互联网大数据分布式文件系统HDFS
■ Hadoop MapReduce并行处理程序编写实体模型、架构与程序编写插口
■ 分布式数据库HBase
■ 分布式系统数据仓库Hive
■ Intel Hadoop优化系统与作用提高
■ MapReduce基本优化算法编程设计
■ MapReduce高級编程设计技术性
■ MapReduce深度学习与大数据挖掘基本优化算法
■ 大数据处理优化算法与运用程序编写实例
目录
- 第一部分 Hadoop系统
- 第1章 大数据处理技术简介 2
- 第2章 Hadoop系统的安装与操作管理 39
- 第3章 大数据存储——分布式文件系统HDFS 56
- 第4章 Hadoop MapReduce并行编程框架 91
- 第5章 分布式数据库HBase 123
- 第6章 分布式数据仓库Hive 179
- 第7章 Intel Hadoop系统优化与功能增强 200
- 第二部分 MapReduce的编程和算法设计
- 第8章 MapReduce基础算法程序设计 220
- 第9章 MapReduce高级程序设计技术 256
- 第10章 MapReduce数据挖掘基础算法 295
- 第11章 大数据处理算法设计与应用编程案例 352