Hadoop源代码分析 第2版(修订版)是一本全面细致介绍和分析Hadoop源码和内部工作机理的技术书籍,通过对Hadoop内部源码详细透彻的解析,使读者能够快速高效地掌握Hadoop的内部工作机制,了解Hadoop内部源码架构,对Hadoop有更加深刻的认识。
本书主要对Hadoop最核心的部分:HDFS和MapReduce进行源码解析和说明。适合所有想全面学习Hadoop开发技术的人员阅读,也适用于使用Hadoop进行开发的工程技术人员,还可作为想深入了解Hadoop运行机制、源代码的开发人员的参考书籍。
目录
- 第1篇 Hadoop概述与安装
- 第1章 Hadoop的简介和安装
- 第2篇 HDFS分布式文件系统及IO模型
- 第2章 HDFS架构和分布式文件系统
- 第3章 Hadoop分布式文件系统HDFS的具体实现
- 第4章 NameNode的实现
- 第5章 Datanode的实现
- 第6章 Hadoop的IO
- 第3篇 MapReduce计算框架及RPC通信模型
- 第7章 MapReduce的输入和输出
- 第8章 Hadoop中的Context和ID
- 第9章 Hadoop的计算模型MapReduce
- 第10章 JobClient的执行过程分析
- 第11章 JobTracker的执行过程分析
- 第12章 Hadoop的作业调度器
- 第13章 TaskTracker的执行过程
- 第14章 Hadoop的RPC协议