本书由微信公众号:狗熊会创始人王汉生教授(熊大),及其核心团队联合创作完成。本书可以被看作商业分析(business analytics)领域入门级通俗且有趣的读物,深入浅出,雅俗共赏。适合数据分析师、工程师、产品经理、销售、BD、以及数据企业中高管阅读。
本书主要由五章组成。第一章介绍了熊大朴素的数据价值观,解读数据与价值的逻辑关系;第二章介绍了基本的数据可视化方法(统计图表)的规范与有趣应用;第三章介绍了回归分析,通过精彩案例展示了如何将一个业务问题定义成为一个数据可分析问题;第四章介绍了机器学习,可以看作是第三章技术上的一个重要补充;第五章展示了各种常见的非结构化数据分析(文本、图像)的有趣案例。本书所有案例内容的原始版本、相关数据资源,都可以从微信公众号狗熊会(ID: CluBear)获得。
目录
- 绪论 大数据时代之“皇帝的新装”
- 第一章 朴素的数据价值观
- 什么是数据?
- 数据的商业价值
- 数据到价值的转化:回归分析的“道”与“术”
- 搞清客户需求
- 中国数据科学的风口
- 第二章 数据可视化
- 实力派:准确+有效
- 偶像派:简洁+美观
- 柱状图
- 堆积柱状图
- 柱状图之妙用
- 饼图
- 直方图
- 折线图
- 散点图
- 箱线图
- 茎叶图
- 第三章回归分析
- 什么是回归分析?
- 线性回归——北京市二手房房价
- 线性回归——中国电影票房
- 线性回归——线上女装销量预测
- 线性回归——股票投资中的均线策略
- 01回归——某移动通信公司客户流失预警分析
- 01回归——车险数据分析与商业价值
- 01回归——点击率预测在RTB广告投放中的应用
- 定序回归——信用卡逾期数据分析
- 计数回归——英超进球谁最强
- 生存回归——新产品在架时长研究
- 第四章 机器学习
- 朴素贝叶斯——12345,有事找政府
- 决策树——非诚勿扰
- 决策树——二手车保值比率那些事儿
- 回归树与提升算法——世界这么大,想去哪儿看看?
- 深度学习——图像自动识别
- 深度学习——打麻将
- K均值聚类——狗熊皮鞋的百度广告投放
- 第五章 非结构化数据
- 中文文本——小说的三要素:以《琅琊榜》为例
- 中文文本——从用户评论看产品改善
- 中文文本——空气净化器的好评率影响因素分析
- 中文文本——数据分析岗位招聘情况的影响因素分析
- 中文文本——张无忌最爱谁
- 网络结构数据——《甄嬛传》中的爱恨情仇
- 图像数据——通过图片识别PM2.5
- 刷卡数据——互联网征信