《R数据科学》是一本关于R语言、数据科学和R社区领军人物的精彩著作,这本书从典型的数据科学项目所需的工具和模型入手,帮助读者掌握R语言的精髓,并教会他们如何熟练使用各种工具来解决各种数据科学难题,书中以可视化为起点,引导读者探索数据,通过重要变量的选取作为主题,让读者深入了解数据科学的核心概念和技术,无论是初学者还是有经验的数据科学从业者,都能从这本书中学到很多有用的知识和技巧,是一本非常实用和有深度的指南,对于想在数据科学领域取得成功的读者来说,绝对是一本必读之作。
R数据科学
内容介绍
本书的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。 读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。 本书适合R数据科学家阅读
目录
- 前言 XV
- 第一部分 探索
- 第1 章 使用ggplot2进行数据可视化 3
- 第2 章 工作流:基础 29
- 第3 章 使用dplyr进行数据转换 33
- 第4 章 工作流:脚本 60
- 第5 章 探索性数据分析 63
- 第6 章 工作流:项目 86
- D二部分 数据处理
- 第7 章 使用tibble实现简单数据框 93
- 第8 章 使用readr进行数据导入 98
- 第9 章 使用dplyr处理关系数据 114
- 第10 章 使用stringr处理字符串 131
- 第11 章 使用forcats处理因子 154
- 第12 章 使用lubridate处理日期和时间 160
- 第三部分 编程
- 第13 章 使用magrittr进行管道操作 179
- 第14 章 函数 185
- 第15 章 向量 201
- 第16 章 使用purrr实现迭代 219
- 第四部分 模型
- 第17 章 使用modelr实现基础模型 243
- 第18 章 模型构建 266
- 第19 章 使用purrr和broom处理多个模型 284
- 第五部分 沟通
- 第20 章 R Markdown 295
- 第21 章 使用ggplot2进行图形化沟通 308
- 第22 章 R Markdown输出类型 331
- 第23 章 R Markdown工作流 339
- 作者简介 341
- 封面简介 341