Spark大数据分析:核心概念、技术及实践是关于大数据和Spark的一个简明手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何使用SparkShell进行交互式数据分析、如何编写Spark应用、如何在Spark中对大规模数据进行交互分析、如何使用SparkStreaming处理高速数据流、如何使用Spark进行机器学习、如何使用Spark进行图处理、如何使用集群管理员部署Spark、如何监控Spark应用等。本书还对其他配合Spark一起使用的大数据技术进行了介绍,包括HDFS、Avro、Parquet、Kafka、Cassandra、HBase、Mesos等。本书也对机器学习和图的概念进行了介绍。
目录
- 第1章 大数据技术一览1
- 第2章 Scala编程16
- 第3章 Spark Core33
- 第4章 使用Spark shell进行交互式数据分析60
- 第5章 编写Spark应用69
- 第6章 Spark Streaming77
- 第7章 Spark SQL99
- 第8章 使用Spark进行机器学习146
- 第9章 使用Spark进行图处理196
- 第10章 集群管理员218
- 第10章 监控