本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。
为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。
目录
- 版权声明
- O'Reilly Media, Inc. 介绍
- 译者序
- 序
- 前言
- 第一部分 考虑 Hadoop 应用的架构设计
- 第 1 章 Hadoop 数据建模
- 第 2 章 Hadoop 数据移动
- 第 3 章 Hadoop 数据处理
- 第 4 章 Hadoop 数据处理通用范式
- 第 5 章 Hadoop 图处理
- 第 6 章 协调调度
- 第 7 章 Hadoop 近实时处理
- 第二部分 案例研究
- 第 8 章 点击流分析
- 第 9 章 欺诈检测
- 第 10 章 数据仓库
- 附录 A Impala 中的关联
- 作者简介
- 封面介绍