数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。
《数据科学与大数据分析——数据的发现 分析 可视化与表示》总共分为12章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用R语言进行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分类、时间序列分析、文本分析等方法。此外,本书还涵盖了用来进行高级数据分析所使用的技术和工具,比如MapReduce和Hadoop、数据库内分析等。
《数据科学与大数据分析——数据的发现 分析 可视化与表示》内容详细,示例丰富,侧重于理论与练习的结合,因此比较适合对大数据分析、数据科学感兴趣的人员阅读,有志于成为数据科学家的读者也可以从本书中获益。
目录
- 第1章 大数据分析介绍 1
- 第2章 数据分析生命周期 23
- 第3章 使用R进行基本数据分析 57
- 第4章 高级分析理论与方法:聚类 107
- 第5章 高级分析理论与方法:关联规则 124
- 第6章 高级分析理论与方法:回归 147
- 第7章 高级分析理论与方法:分类 175
- 第8章 高级分析理论与方法:时间序列分析 212
- 第9章 高级分析理论与方法:文本分析 232
- 第10章 高级分析技术与工具:MapReduce和Hadoop 267
- 第11章 高级分析技术与工具:数据库内分析 297
- 第12章 结尾 324