这书融合基础理论和实践活动,循序渐进,多方位详细介绍了Hadoop 这一性能的海量数据处理和剖析服务平台。全书5一部分24 章,第Ⅰ一部分详细介绍Hadoop 基本知识,第Ⅱ一部分详细介绍MapReduce,第Ⅲ一部分详细介绍Hadoop 的运维管理,第Ⅳ一部分详细介绍Hadoop 有关开源网站项目,第Ⅴ一部分出示了3个案例,各自来源于医疗服务信息科技服务提供商塞纳(Cerner)、微软公司的人工智能技术新项目ADAM(这种规模性分布式系统深度神经网络架构)和开源网站项目Cascading(1个新的对于MapReduce 的数据处理方法API)。这书是1本技术专业、全方位的Hadoop 教材和工具书,论述了Hadoop 生态链的新发展趋势和应用,程序猿能够 从这当中探寻海量信息集的储存和剖析,管理人员能够 从这当中掌握Hadoop 集群服务器的安裝和运维管理。这书融合基础理论和实践活动,循序渐进,多方位详细介绍了Hadoop这一性能的海量数据处理和剖析服务平台。全书5一部分24章,第Ⅰ一部分详细介绍Hadoop基本知识,主题风格涉及到Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O实际操作。第Ⅱ一部分详细介绍MapReduce,主题风格包含MapReduce应用程序开发;MapReduce的工作方案、MapReduce的种类与文件格式、MapReduce的特点。第Ⅲ一部分详细介绍Hadoop的运维管理,主题风格涉及到搭建Hadoop集群服务器、管理方法Hadoop。第Ⅳ一部分详细介绍Hadoop有关开源网站项目,主题风格涉及到Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ一部分出示了3个案例,各自来源于医疗服务信息科技服务提供商塞纳(Cerner)、微软公司的人工智能技术新项目ADAM(这种规模性分布式系统深度神经网络架构)和开源网站项目Cascading(1个新的对于MapReduce的数据处理方法API)。 这书是1本权威性、全方位的Hadoop教材和工具书,论述了Hadoop生态链的*发展趋势和应用,程序猿能够 从这当中探寻海量信息集的储存和剖析,管理人员能够 从这当中掌握Hadoop集群服务器的安裝和运维管理。
目录
- 第1章 初识Hadoop
- 第2章 关于MapReduce
- 第3章 Hadoop分布式文件系统
- 第4章 Hadoop的I/O操作
- 第5章 MapReduce应用开发
- 第6章 MapReduce的工作机制
- 第7章 MapReduce的类型与格式
- 第8章 MapReduce的特性
- 第9章 构建Hadoop集群
- 第10章 管理Hadoop
- 第11章 关于Pig
- 第12章 关于Hive
- 第13章 关于HBase
- ......