深入理解Hadoop(原书第2版)创作者应用场景对Hadoop系统软件的实践活动,从入门到精通地对Hadoop开展了详尽的解读,包括很多的案例和方法,可协助有必须基本的开发人员迅速把握分布式系统。
这书主题思想包含:第1章~第4章解读大信息系统的基本要素、Hadoop系统软件的重要定义,及其开展Hadoop服务平台管理方法的重要定义因素。第5章~第7章是这书的重中之重,详细分析了MapReduce架构,不但包含MapReduce架构的API,还详细介绍MapReduce架构的更繁杂定义以及设计构思。第8章~第14章详细介绍Hadoop生态体系,包含适用MapReduce程序流程的单元测试和集成测试架构、Hadoop系统软件的监控器和系统日志系统软件、Hive架构、Pig和Crunch架构、HCatalog架构、Hadoop系统日志流解决、HBase等。第15章~第18章详细介绍了计算机科学基本要素及运用、云计算技术案例、分布式系统免费下载服务项目案例等。
目录
- 第1章为什么会有大数据
- 第2章Hadoop中的概念
- 第3章初识Hadoop框架
- 第4章Hadoop系统管理
- 第5章MapReduce开发基础
- 第6章MapReduce开发进阶
- 第7章 Hadoop输入/输出
- 第8章 测试Hadoop程序
- 第9章Hadoop的监控
- 第10章使用Hadoop构建数据仓库
- 第11章 使用Pig进行数据处理
- 第12章 HCatalog和企业级Hadoop
- 第13章 使用Hadoop分析日志
- 第14章 使用HBase构建实时系统
- 第15章 Hadoop与数据科学
- 第16章 Hadoop与云计算
- 第17章 构建YARN应用程序