本书现有12章,从Hadoop渊源刚开始,介绍了Hadoop的安裝和配备,并对Hadoop的组件分別开展了介绍,包含HDFS分布式文件系统系统软件,MapReduce测算框架结构,大量数据库查询HBase,Hive数据仓库,Pig、ZooKeeper智能管理系统等专业知识,最终对Hadoop即时数据处理方法技术性作了简易介绍,旨在让读者掌握当今的其他的大数据处理技术性。这书除开对Hadoop的基础理论开展表明以外,还对怎么使用各组件开展了介绍,但介绍的仅仅基础的应用,沒有涉及最底层的高級內容,因此这书仅仅起一个正确引导功效,旨在让读者掌握Hadoop并可以应用Hadoop的基本要素,并非学习培训Hadoop的彻底指南。 这书适用高等学校的学员;是云计算技术专业、物联网专业及云计算与大数据专业的关键基础课程内容,都是计算机相关技术专业的一门增加专业科目或选修课;合适于零售及云计算与云计算技术有关的培训机构等应用。
目录
- Hadoop基础与实践 第1章Hadoop概述
- 1.1 Hadoop来源和动机
- 1.2 Hadoop体系架构
- 1.3 Hadoop与分布式开发
- 1.4 Hadoop行业应用案例分析
- 1.4.1 Hadoop在门户网站的应用
- 1.4.2 Hadoop在搜索引擎中的应用
- 1.4.3 Hadoop在电商平台中的应用
- 1.5小结 第2章Hadoop安装与配置管理
- 2.1 实验准备
- 2.2 配置一个单节点环境
- 2.2.1 运行一个虚拟系统CentOS
- 2.2.2 配置网络
- 2.2.3创建新的用户组和用户
- 2.2.4上传文件到CentOS并配置Java、Hadoop环境
- 2.2.5 修改Hadoop2.2配置文件
- 2.2.6修改CentOS主机名
- 2.2.7绑定hostname与IP
- 2.2.8关闭防火墙
- 2.3节点之间的免密码通信
- 2.3.1什么是SSH
- 2.3.2 拷贝虚拟机节点
- 2.3.3 配置SSH免密码登录
- 2.4 Hadoop的启动和测试
- 2.4.1 格式化文件系统
- 2.4.2启动HDFS
- 2.4.3 启动Yarn
- 2.4.4 管理JobHistory Server
- 2.4.5 集群验证
- 2.4.6 需要了解的默认配置 2.5动态管理节点
- 2.5.1 动态增加和删除datanode
- 2.5.2 动态修改TaskTracker
- 2.6小结 第3章HDFS技术
- 3.1HDFS的特点
- 3.2HDFS架构
- 3.2.1数据块
- 3.2.2元数据节点与数据节点
- 3.2.3辅助元数据节点
- 3.2.4安全模式
- 3.2.5负载均衡
- 3.2.6垃圾回收
- 3.3HDFS Shell命令
- 3.3.1文件处理命令
- 3.3.2dfsadmin命令
- 3.3.3namenode命令
- 3.3.4fsck命令
- 3.3.5pipes命令
- 3.3.6job命令
- 3.4HDFS中Java API的使用
- 3.4.1上传文件
- 3.4.2新建文件
- 3.4.3查看文件详细信息
- 3.4.4下载文件
- 3.5RPC通信
- 3.5.1反射机制
- 3.5.2代理模式与动态代理
- 3.5.3Hadoop RPC机制与源码分析
- 3.6小结 第4章Map/Reduce技术 4