编辑推荐
如何恢复销售额?哪种广告的效果会更好?游戏用户为何会流失?如何让组队游戏充满乐趣?……一线数据分析师教你用数据搞定!1.通过8个真实的商业案例,学会用数据分析解决商业难题。2.使用未经清洗的原始数据,体验真实的数据分析流程。 (在其他同类书中,经常故意使用和书中内容高度相符的数据来分析,但是读者会发现在实际的业务中使用书中的方法却很困难,数据分析实战 的各个案例中提供的都是zui原始的数据,需要在使用前进行加工。针对这些数据,如何灵活使用统计解析工具来处理,作者也给出了详细的介绍。)3.网罗柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、主成分分析、聚类、决策树分析、机器学习等数据分析方法。4.数据分析实战 使用的数据和R脚本代码可下载。
内容简介
数据分析实战 由实战经验丰富的两位数据分析师执笔,数据分析实战 首先介绍了商业领域里通用的数据分析框架,然后根据该框架,结合8个真实的案例,详细解说了通过数据分析解决各种商业问题的流程,让读者在解决问题的过程中学习各种数据分析方法,包括柱状图、交叉列表统计、A B测试、多元回归分析、逻辑回归分析、聚类、主成分分析、决策树分析、机器学习等。特别是书中使用的数据都是未经清洗的原始数据,对如何加工数据以用于数据分析也进行了详细的介绍。读者可以使用R语言实际操作数据,体验真实的数据分析流程,避免纸上谈兵。
目录
- 第1章数据科学家的工作1
- 1.1什么是数据科学家2
- 1.23种类型的数据科学家5
- 1.3数据科学家的现状8
- 第2章商业数据分析流程9
- 2.1数据分析的5个流程10
- 2.2现状和预期12
- 2.3发现问题13
- 2.4数据的收集和加工19
- 2.5数据分析24
- 2.6解决对策27
- 2.7小结29
- [分析基础]篇
- 第3章案例1—柱状图
- 为什么销售额会减少35
- 3.1现状和预期36
- 3.2发现问题38
- 3.3数据的收集和加工39
- 3.4数据分析46
- 3.5解决对策49
- 3.6小结50
- 3.7详细的R代码51
- 第4章案例2—交叉列表统计
- 什么样的顾客会选择离开61
- 4.1现状和预期62
- 4.2发现问题64
- 4.3数据的收集和加工65
- 4.4数据分析69
- 4.5解决对策73
- 4.6小结75
- 4.7详细的R代码76
- 第5章案例3—A/B测试
- 哪种广告的效果更好83
- 5.1现状和预期84
- 5.2发现问题86
- 5.3数据的收集和加工88
- 5.4数据分析96
- 5.5解决对策98
- 5.6小结99
- 5.7详细的R代码100
- 第6章案例4—多元回归分析105
- 如何通过各种广告的组合获得更多的用户105
- 6.1现状和预期106
- 6.2发现问题108
- 6.3数据的收集112
- 6.4数据分析114
- 6.5解决对策117
- 6.6小结119
- 6.7详细的R代码120
- [分析应用]篇
- 第7章案例5—逻辑回归分析
- 根据过去的行为能否预测当下125
- 7.1期望增加游戏的智能手机用户量126
- 7.2是用户账号迁转设定失败导致的问题吗128
- 7.3在数据不包含正解的情况下收集数据131
- 7.4验证是否能够建立模型144
- 7.5解决对策148
- 7.6小结149
- 7.7详细的R代码150
- 第8章案例6—聚类
- 应该选择什么样的目标用户群163
- 8.1希望了解用户的特点164
- 8.2基于行为模式的用户分类165
- 8.3把主成分作为自变量来使用168
- 8.4进行聚类176
- 8.5解决对策180
- 8.6小结181
- 8.7详细的R代码182
- 第9章案例7—决策树分析
- 具有哪些行为的用户会是长期用户193
- 9.1希望减少用户开始游戏后不久就离开的情况194
- 9.2了解“乐趣”的结构195
- 9.3把类作为自变量198
- 9.4进行决策树分析210
- 9.5解决对策213
- 9.6小结215
- 9.7详细的R代码216
- 第10章案例8—机器学习
- 如何让组队游戏充满乐趣233
- 10.1使组队作战的乐趣ZUI大化234
- 10.2利用数据分析为服务增加附加价值236
- 10.3在数据中排除星期的影响238
- 10.4构建预测模型241
- 10.5解决对策248
- 10.6小结249
- 10.7详细的R代码250
现在讲数据分析的书大体有四类:一种是纯机器/统计学习的,每(几)种方法就换一个生僻领域(海藻分类、森林覆盖率),对商业分析者很不友好;一种是看上去是数据分析,其实是编程指南;第三种是非常好的框架书,框架头头是道,但是没有数据,也没有实战;第四种是和这本类似的,重在「分析」而不是「算法」上,用完整的案例讲真的会遇到的问题,应该如何拆解,如何解决,能看到商业分析对数据质量更包容,处理方法也更灵活。各有千秋,但对我来说目前还是第四种最有帮助。
每一章都有详尽的R代码,但是思维建立过程不是很流畅,跟起来有点难,算法也只是提及皮毛并未深入讲述原理。所以导致看完也只能知道某个特定场景可以尝试特定的算法应用,举一反三有点难。