Spark大数据处理: 原理、算法与实例以当下时兴的Hadoop所存有的缺点为立足点,从入门到精通地详细介绍了下一代大数据处理关键技术Spark的优点和重要性,并以简约的引导流程展现了怎样在十分钟内创建一个Spark大数据处理自然环境。在这个基础上,这书以图片配文字和丰富多彩的示例编码解读的方式针对性地表明了Spark的运作原理、算子应用、算法设计和提升方式,为阅读者出示了一个迅速循序渐进把握Spark基本能力和高級方法的参照书藉。
这书共六章,涉及到的主题风格关键包含大数据处理技术性从Hadoop发展趋势到Spark的偶然性、迅速感受Spark的引导、Spark构架和原理、RDD算子操作方法和示例、Spark算法设计案例、Spark程序流程优化方法。
这书合适必须应用Spark开展大数据处理的程序猿、系统架构师和产品运营做为技术性参照和培训课件,也可以做为高等院校硕士研究生和本科毕业教材内容。
目录
- 第1章从Hadoop到Spark
- 第2章体验Spark
- 第3章Spark原理
- 第4章RDD算子
- 第5章Spark算法设计
- 第6章善用Spark