Hadoop核心技术
作者:翟周伟 著
出版时间:2015年版
容简介
这是一本技术深度与企业实践并重的著作,由百度顶尖的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:(1)使用:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统;(2)原理:结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理;(3)运维:结合百度的实际生产环境,详细讲解了Hadoop集群的安装、配置、测试以及管理和运维;(4)开发:详细讲解了HadoopStreaming、Pipes的使用和开发实践,以及MapReduce的编程实践和常见问题。与市面上已有的Hadoop相比,本书的最大不同之处是它直切企业应用和实践Hadoop技术的痛点,深入讲解了企业最需要和最头疼的技术和问题,内容上非常聚焦。
目录
- 前言
- 基础篇
- 第1章 认识Hadoop
- 第2章 Hadoop使用之初体验
- 第3章 Hadoop存储系统
- 第4章 HDFS的使用
- 第5章 MapReduce计算框架
- 第6章 Hadoop命令系统
- 高级篇
- 第7章 MapReduce深度分析
- 第8章 Hadoop Streaming和Pipes原理与实现
- 第9章 Hadoop作业调度系统
- 实战篇
- 第10章 Hadoop集群搭建
- 第11章 Hadoop Streaming和Pipes编程实战
- 第12章 Hadoop MapReduce应用开发