Hadoop是现阶段选用最广、最重要的一种开源系统的大数据处理服务平台,了解Hadoop的源代码,深层次了解其各种各样原理,针对把握大数据处理的技术性拥有不言而喻的必要性。毛德操著的《大数据处理系统(Hadoop源代码情景分析)》从大数据处理的原理刚开始,提到Hadoop的来历,从而叙述针对编码的研究思路,随后以Hadoop做为样版,比较详细地逐一剖析大数据处理服务平台各关键构成部分的编码,并从宏观经济上叙述这种一部分的联络和功效。
这书延用作者与众不同而广火爆的场景统计分析方法和设计风格,从入门到精通直接通俗易懂,能够 做为大信息系统高级课程的教材内容,也可作为计算机技术技术专业和别的有关技术专业本科高学段学员和硕士研究生深层次学习大数据系统软件的教材。另外,还能够做为各制造行业从业开发软件和大数据挖掘的技术工程师、科学研究工作人员及其别的对大数据处理技术性很感兴趣者的自学教材。
目录
- 第1章 大数据与Hadoop
- 第2章 研究方法
- 第3章 Hadoop集群和YARN
- 第4章 Hadoop的RPC机制
- 第5章 Hadoop作业的提交
- 第6章 作业的调度与指派
- 第7章 NodeManager与任务投运
- 第8章 MRAppMaster与作业投运
- 第9章 YARN子系统的计算框架
- 第10章 MapReduce框架中的数据流
- 第11章 Hadoop的文件系统HDFS
- 第12章 HDFS的DataNode
- 第13章 DataNode与NameNode的互动
- 第14章 DataNode间的互动
- 第15章 HDFS的文件访问
- 第16章 Hadoop的容错机制
- 第17章 Hadoop的安全机制
- 第18章 Hadoop的人机界面
- 第19章 Hadoop的部署和启动
- 第20章 Spark的优化与改进