《实时大数据分析》是一本内容丰富、权威性强的书籍。书中详细阐述了实时大数据分析的实现过程,特别是对于大数据分析平台(如Storm和Spark)的介绍非常详细。读者可以通过该书了解到大数据分析的技术前景以及各种分析平台的特点和使用方法。如果你对实时大数据分析感兴趣,这本书绝对是你不可错过的学习资料。
'
实时大数据分析:基于Storm、Spark技术的实时应用电子书封面
读者评价
只是将storm 和spark 简单系统性介绍一遍,实用性不高,理解概括罢了。
一本技术性实用的工具书,但也只能用于扫盲阶段。
同样重要的,就是采集和使用大数据的风险。因为大数据并非采集和使用大数据的公司所产生的,它是由一个庞大的用户或者普通人群所产生的。在数据的采集和使用过程中,对隐私的侵占,对个人信息的保护,如何做到透明,如何保护我们自己,因为如果一点保护都没有,那最后每个人都是受害者。
内容介绍
本书详细阐述了实时大数据分析的实现过程,主要包括大数据技术前景及分析平台;熟悉Storm平台;用Storm处理数据;Trident介绍和Storm性能优化;熟悉Kinesis;熟悉Spark;RDD编程;Spark的SQL查询引擎;Spark Streaming分析流数据以及Lambda架构等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
目录
- 第1章 大数据技术前景及分析平台 1
- 第2章 熟悉Storm 19
- 第3章 用Storm处理数据 37
- 第4章 Trident概述和Storm性能优化 59
- 第5章 熟悉Kinesis 84
- 第6章 熟悉Spark 106
- 第7章 使用RDD编程 136
- 第8章 Spark的SQL查询引擎——Spark SQL 160
- 第9章 用Spark Streaming分析流数据 195
- 第10章 介绍Lambda架构 220
大数据分析6个核心技术 目前,大数据领域每年都会涌现出大量新的技术,成为大数据获取、存储、处理分析或可视化的有效手段。大数据技术能够将大规模数据中隐藏的信息和知识挖掘出来,为人类社会经济活动提供依据,提高各个领域的运行效率,甚至整个社会经济的集约化程度。 1大数据生命周期 2.大数据技术生态 3.大数据采集与预处理 4.大数据存储与管理 5.大数据计算模式与系统 6.大数据分析与可视化
我们正处于一个信息化的时代。在信息化时代,我们认为[1]数据就是金钱、就是成功的根基。借助于电脑和卫星等科技的帮助,我们能够收集大量的数据。起初,我们利用电脑和各式各样的存储技术来存储各种形态的数据。然而,随着时间的推移,大量的异构的数据存储构成的数据集就变的异常的庞大。 随着因特网在全球范围的普及,数据量变的如此的巨大,以至于使用现有的数据管理方法或者传统的数据处理应用很难应付。上述所提到的大规模、大体量的数据集我们就称之为大数据。