《R语言数据分析项目精解:理论、方法、实战》是由电子工业出版社出版的一本关于R语言方面的书籍,作者是罗荣锦,主要介绍了关于R语言、数据分析、理论、方法、实战方面的知识内容,目前在R语言类书籍综合评分为:9.6分。
书籍介绍
it行业数据统计分析工作人员:根据阅读文章这书,能够把学得的专业知识立即应用到生活实践中。
互联网技术商品策划工作人员:根据阅读文章这书,能够掌握数据统计分析精英团队通常是怎样适用商品策划工作人员的,及其数据统计分析精英团队能协助商品策划工作人员做什么,商品策划工作人员未来能够尽快给数据统计分析精英团队明确提出剖析要求。
统计分析技术专业高等院校生:这书能够做为制造行业实践活动实例教材内容,在学习培训学习知识的另外尽快掌握具体情况,与众不同的事开展实践活动,提升实战演练工作能力。
别的行业数据统计分析工作人员:能够掌握it行业是怎样开展数据统计分析和实体模型开发设计的,互相沟通交流和学习培训。
着眼于数据统计分析工作中的发烧友:这书能够做为数据统计分析从业者互相沟通交流、沟通交流的公路桥梁。
R語言发烧友:R語言的运用渗入生活实践的各个方面,这书既解读互联网技术电子商务具体新项目,也是R語言沟通交流的服务平台。
这书以互联网技术电子商务公司为背景图,抽象性出工作上普遍的数据统计分析难题,运用 R 語言和生物学列举了详尽的解决方法和全过程。这书共 9 章,前两章各自为总论和 R 語言新手入门专业知识,以后各章各自详细介绍了经营指标值的创建、指标值视频监控系统、假设检验及 AB 检测、自变量挑选技术性、客户画像系统软件、找寻高品质客户和文本挖掘等內容。这书涉及的统计方法有:指标值增长率量化分析方式、层次分析法、时间序列模型、根据正态分布的1元离群点检测、傅里叶谱分析、假设检验、主成分分析、因子分析、模糊不清聚类算法、无监管下连续型自变量离开化、逻辑回归模型和文本挖掘等。另一个,这书出示了全部案例的 R 語言保持编码,累计 33 个自定涵数和千余行编码。这书合适数据统计分析从业者、商品策划工作人员、统计分析技术专业大学生和 R 語言发烧友阅读文章。
目录
- 第 1 章 互联网 统计学 R 语言1
- 1.1 互联网中的统计学1
- 1.1.1 “互联网 ”的发展1
- 1.1.2 统计学的发展2
- 1.1.3 大数据时代的统计学2
- 1.2 R 语言——互联网与统计学的桥梁3
- 1.3 本书结构 5
- 第 2 章 R 语言基础 7
- 2.1 安装 R 语言 7
- 2.1.1 获取和安装 R 语言 7
- 2.1.2 安装 RStudio 9
- 2.1.3 R 包 10
- 2.1.4 帮助12
- 2.2 R 语言基本对象12
- 2.2.1 数据类型12
- 2.2.2 向量12
- 2.2.3 矩阵和数组19
- 2.2.4 列表27
- 2.2.5 数据框29
- 2.2.6 因子32
- 2.2.7 数据类型的辨别和转换39
- 2.2.8 数据类型和对象关系 39
- 2.3 工作空间和查看对象 40
- 2.3.1 工作空间和工作目录 40
- 2.3.2 遍历、创建、删除文件夹 41
- 2.3.3 查看对象的方法 42
- 2.4 数据导入和导出43
- 2.4.1 数据导入43
- 2.4.2 数据导出49
- 2.5 操作符和函数51
- 2.5.1 操作符51
- 2.5.2 函数54
- 2.6 数据集操作59
- 2.6.1 变量操作60
- 2.6.2 数据集操作63
- 2.6.3 数据集连接67
- 2.6.4 数据汇总68
- 2.7 控制流71
- 2.7.1 重复和循环71
- 2.7.2 条件执行73
- 2.7.3 next 和 break 74
- 2.8 自定义函数75
- 第 3 章 互联网运营指标的建立77
- 3.1 项目背景、目标及方案78
- 3.1.1 项目背景78
- 3.1.2 项目目标78
- 3.1.3 项目方案78
- 3.2 项目技术理论简介78
- 3.2.1 骨灰级流量指标 78
- 3.2.2 登录和激活80
- 2.2.3 访问深度和吸引力 81
- 3.2.4 订单指标85
- 3.2.5 网站或 APP 性能指标86
- 3.2.6 转化率87
- 3.2.7 层次分析法87
- 3.3 项目实践 92
- 3.3.1 搭建运营指标系统 92
- 3.3.2 制作对比型指标及趋势线 97
- 3.3.3 创建用户价值和活跃度指标 101
- 第 4 章 指标监控系统111
- 4.1 项目背景、目标及方案 111
- 4.1.1 项目背景111
- 4.1.2 项目目标111
- 4.1.3 项目方案112
- 4.2 项目技术理论简介112
- 4.2.1 时间序列基本统计量 112
- 4.2.2 数据观测与描述性统计 113
- 4.2.3 随机性115
- 4.2.4 周期性115
- 4.2.5 节假日模式识别 115
- 4.2.6 建模数据集的建立 118
- 4.2.7 指标监控方法(不含节假日)125
- 4.2.8 节假日指标监控方法 134
- 4.2.9 R 语言实例代码 135
- 4.3 项目实践 141
- 4.3.1 数据概览142
- 4.3.2 节假日模式识别 145
- 4.3.3 模型数据集的建立 155
- 4.3.4 指标监控(非节假日)160
- 4.3.5 节假日指标监控 176
- 4.3.6 总结181
- 第 5 章 用数据驱动业务——AB 测试 182
- 5.1 项目背景、目标和方案 182
- 5.1.1 项目背景182
- 5.1.2 项目目标183
- 5.1.3 项目方案183
- 5.2 项目技术理论简介183
- 5.2.1 自动化分流策略 183
- 5.2.2 整体评估指标185
- 5.2.3 概率论预备知识 186
- 5.2.4 假设检验191
- 5.2.5 三个问题197
- 5.3 项目实践 197
- 第 6 章 变量筛选技术204
- 6.1 项目背景、目标和方案 204
- 6.1.1 项目背景204
- 6.1.2 项目目标205
- 6.1.3 项目方案205
- 6.2 项目技术理论简介205
- 6.2.1 变量相关性206
- 6.2.2 变量筛选209
- 6.2.3 变量降维215
- 6.2.4 R 语言实例代码 225
- 6.3 项目实践 237
- 6.3.1 变量筛选238
- 6.3.2 变量降维243
- 第 7 章 构建用户画像系统 247
- 7.1 项目背景、目标和方案 247
- 7.1.1 项目背景247
- 7.1.2 项目目标248
- 7.1.3 项目方案248
- 7.2 项目技术理论简介248
- 7.2.1 用户画像的基本概念 248
- 7.2.2 用户画像应用领域 249
- 7.2.3 用户画像分类250
- 7.2.4 用户画像构建250
- 7.2.5 用户画像标签的数值处理方法 254
- 7.3 项目实践 256
- 第 8 章 从数据中寻找优质用户 261
- 8.1 项目背景、目标和方案 261
- 8.1.1 项目背景261
- 8.1.2 项目目标262
- 8.1.3 项目方案262
- 8.2 项目技术理论简介262
- 8.2.1 逻辑回归的基本概念 262
- 8.2.2 建模流程266
- 8.2.3 模型开发阶段269
- 8.2.4 模型验证阶段279
- 8.2.5 模型测试阶段285
- 8.2.6 商业应用流程288
- 8.2.7 R 语言实例代码 288
- 8.3 项目实践 295
- 8.3.1 数据探索295
- 8.3.2 数据处理297
- 8.3.3 建立模型302
- 8.3.4 模型验证304
- 8.3.5 总结308
- 第 9 章 文本挖掘——点评数据展示策略 309
- 9.1 项目背景、目标和方案 310
- 9.1.1 项目背景310
- 9.1.2 项目目标311
- 9.1.3 项目方案311
- 9.2 项目技术理论简介312
- 9.2.1 评论文本质量量化指标模型 312
- 9.2.2 用户相似度模型 313
- 9.2.3 情感性分析316
- 9.2.4 R 语言实例代码 321
- 9.3 项目实践 326
- 9.3.1 若干自定义函数 326
- 9.3.2 文本质量量化指标模型 329
- 9.3.3 用户相似度模型 334
- 9.3.4 情感性分析335
- 9.3.5 总结340