本书通过原理加案例的方式系统地讲解了Hadoop大数据开发,让读者能够全面地了解大数据开发流程。书中精心安排了原理分析、环境搭建、案例开发等多个过程,使读者对解决大数据问题有清晰的思路。全书共7章:前6章系统讲解大数据Hadoop架构,包括大数据处理平台Hadoop、分布式文件系统HDFS、并行计算模型MapReduce、资源调度框架Yarn;第7章是MapReduce应用实例,通过案例帮助读者进一步理解Hadoop平台。全书突出3个特点:道理简单明了、思路清晰透彻、案例新颖实用。本书不仅可作为普通高校大数据相关专业学生的大数据教材,也可以作为想深入了解Hadoop架构编程的人员的参考书,还可作为各类相关培训班的培训教材。
目录
- 前言
- 第1章 大数据概论
- 1.1 大数据概述
- 1.1.1 大数据产生的时代背景
- 1.1.2 大数据的特征
- 1.1.3 大数据应用案例
- 1.1.4 大数据的机遇与挑战
- 1.2 大数据处理技术
- 1.3 大数据与云计算
- 1.4 本章小结
- 第2章 大数据处理平台Hadoop
- 2.1 Hadoop生态系统
- 2.2 Hadoop架构
- 2.2.1 HDFS
- 2.2.2 MapReduce
- 2.2.3 Yam
- 2.3 Hadoop版本变迁
- 2.3.1 Hadoop发展史
- 2.3.2 如何选择Hadoop开发版本
- 2.4 本章小结
- 部分目录