Spark机器学习
内容介绍
本书结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、降维等经典机器学习算法及其实际应用。第2版新增了有关机器学习数学基础以及Spark ML Pipeline API 的章节,内容更加系统、全面、与时俱进。
目录
- 第1章 Spark的环境搭建与运行 1
- 第2章 机器学习的数学基础 44
- 第3章 机器学习系统设计 73
- 第4章 Spark上数据的获取、处理与准备 89
- 第5章 Spark 构建推荐引擎 127
- 第6章 Spark构建分类模型 165
- 第7章 Spark构建回归模型 212
- 第8章 Spark构建聚类模型 257
- 第9章 Spark应用于数据降维 288
- 第10章 Spark高级文本处理技术 308
- 第11章 Spark Streaming实时机器学习 335
- 第12章 Spark ML Pipeline API 360