大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。 适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。
本文档主要介绍Hadoop、Hive、Spark、Storm、Flink、HBase、Kafka、Zookeeper、Flume、Sqoop、Azkaban、Scala集成的使用
目录
- 前 言
- 一、Hadoop
- 二、Hive
- 三、Spark
- 四、Storm
- 五、Flink
- 六、HBase
- 七、Kafka
- 八、Zookeeper
- 九、Flume
- 十、Sqoop
- 十一、Azkaban
- 十二、Scala
- 十三、公共内容
- 后 记 资料分享与开发工具推荐