熟练Hadoop是1本由浅入深的具体指导指南,重中之重详细介绍了Hadoop的高級定义和特点。内容包括了Hadoop 2.X版的改善,MapReduce、Pig和Hive等的提升以及高級特点,Hadoop 2.0的专享特点(如YARN和HDFS协同),及其怎么使用Hadoop2.0版本号拓展Hadoop的工作能力。
假如你要扩展自身的Hadoop专业知识和专业技能,想解决具备趣味性的数据处理方法难题,想让Hadoop工作、Pig脚本制作和Hive查寻运作得迅速,或是想掌握升級Hadoop的益处,那麼这书就是你的不二之选。
根据阅读文章这书,你将可以:
了解从Hadoop 1.3到Hadoop 2.2的转变
订制和提升Hadoop 2.2中的MapReduce工作
研究Hadoop I/O和不一样的数据格式
加强学习YARN和Storm,并根据YARN集成化Hadoop和Storm
应用场景amazonElasticMapReduce布署Hadoop
研究HDFS代替品,学习培训HDFS协同
把握Hadoop安全性层面的主题思想
应用Mahout和RHadoop开展Hadoop数据统计分析
目录
- 第1章 Hadoop 2.X 1
- 第2章 MapReduce进阶 17
- 第3章 Pig进阶 47
- 第4章 Hive进阶 77
- 第5章 序列化和Hadoop I/O 95
- 第6章 YARN——其他应用模式进入Hadoop的引路人 116
- 第7章 基于YARN的Storm——Hadoop中的低延时处理 142
- 第8章 云上的Hadoop 162
- 第9章 HDFS替代品 176
- 第10章 HDFS联合 190
- 第11章 Hadoop安全 201
- 第12章 使用Hadoop进行数据分析 218