《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。
《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。
目录
- 第一部分Spark概述1
- 第1章初识Spark 3
- 第二部分Spark核心概念13
- 第2章Spark整体框架 15
- 第3章SparkContext初始化 23
- 第4章Spark作业提交 33
- 第5章部署方式分析 91
- 第三部分Spark Lib 129
- 第6章Spark Streaming 131
- 第7章SQL 173
- 第8章GraphX 215