图解Spark:核心技术与案例实战以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架,同时还介绍了Spark 生态圈相关组件,包括了Spark SQL 的即席查询、Spark Streaming 的实时流处理应用、MLbase/MLlib 的机器学习、GraphX 的图处理、SparkR 的数学计算和Alluxio 的分布式内存文件系统等。
本书从Spark 核心技术进行深入分析,重要章节会结合源代码解读其实现原理,围绕着技术原理介绍了相关典型实例,读者通过这些实例可以更加深入地理解Spark 的运行机制。另外本书还应用了大量的图表进行说明,通过这种方式让读者能够更加直观地理解Spark 相关原理。
目录
- 第一篇 基础篇
- 第1章 Spark及其生态圈概述
- 第2章 搭建Spark实战环境
- 第二篇 核心篇
- 第3章 Spark编程模型
- 第4章 Spark核心原理
- 第5章 Spark存储原理
- 第6章 Spark运行架构
- 第三篇 组件篇
- 第7章 Spark SQL
- 第8章 Spark Streaming
- 第9章 Spark MLlib
- 第10章 Spark GraphX
- 第11章 SparkR
- 第12章 Alluxio