Spark最佳实践是Spark实战指南,全书共分8章。前4章介绍Spark的部署、工作机制和内核,后4章分别通过实战项目介绍SparkSQL、SparkStreaming、SparkGraphX和SparkMLib功能模块。此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。
目录
- 第1 章 Spark 与大数据 1
- 第2 章 Spark 基础 8
- 第3 章 Spark 工作机制 58
- 第4 章 Spark 内核讲解 77
- 第5 章 Spark SQL 与数据仓库 92
- 第6 章 Spark 流式计算 122
- 第7 章 Spark 图计算 149
- 第8 章 Spark MLlib 169