这书是为众多数据分析师量身定做的门读本,它致力于协助读者立在大数据时代的制高。数据分析处在应用统计学、计算机软件科学研究、运筹学、数据库查询等好几个行业的交叉式地区,大数据时代的来临大大的丰富多彩了数据分析的内函,数据分析师的岗位职责与过去对比发生了极大的更改。这书全方位详细介绍了經典数据分析、系统识别、深度学习、深度神经网络、数据挖掘、商务智能等好几个行业的数据分析算法,将大数据时代的数据分析热技术性一网尽。这书为每一个数据分析算法都配搭了一个成功案例,并依照由浅入深的标准搭建知识框架,充足照料了不一样水准读者的阅读习惯。根据阅读文章这书,读者将对大数据时代下的数据分析有一个全方位的了解。不论是门级的数据分析员還是有一定基本的数据分析师,都能根据这书健全、加重对数据分析的了解。这书是为众多数据分析师量身定做的门读本,它致力于协助读者立在大数据时代的制高。数据分析处在应用统计学、计算机软件科学研究、运筹学、数据库查询等好几个行业的交叉式地区,大数据时代的来临大大的丰富多彩了数据分析的内函,数据分析师的岗位职责与过去对比发生了极大的更改。这书全方位详细介绍了經典数据分析、系统识别、深度学习、深度神经网络、数据挖掘、商务智能等好几个行业的数据分析算法,将大数据时代的数据分析热技术性一网尽。这书为每一个数据分析算法都配搭了一个成功案例,并依照由浅入深的标准搭建知识框架,充足照料了不一样水准读者的阅读习惯。根据阅读文章这书,读者将对大数据时代下的数据分析有一个全方位的了解。不论是门级的数据分析员還是有一定基本的数据分析师,都能根据这书健全、加重对数据分析的了解。
这本书不规定读者的编程技术和数学思维训练,以尽可能浅显易懂的語言来表述晦涩难懂的数据挖掘算法基本原理,这书所保存的公式全是*基础的、迫不得已保存的公式计算,这将这书的阅读文章门坎降至了**。学习培训这书,读者将把握*好用的数据挖掘算法,并可以马上运用他们。
目录
- 内容简介
- 前言
- 第1章 经典的探索性数据分析案例
- 1.1 探索性数据分析综述
- 1.2 数据巧收集——红牛的大数据营销案例
- 1.2.1 状况百出的红牛企业
- 1.2.2 红牛企业巧妙收集消费者数据
- 1.2.3 数据收集小结
- 1.3 数据可视化——数据新闻促使英军撤军
- 1.3.1 维基解密带来的海量数据
- 1.3.2 百花齐放的数据新闻
- 1.3.3 数据可视化小结
- 1.4 异常值分析——Facebook消灭钓鱼链接
- 1.4.1 Facebook和广告商之间的拉锯战
- 1.4.2 异常值分析指导排名算法工作
- 1.4.3 异常值分析小结
- 1.5 对比分析——TrueCar指导购物者寻找最合算的车价
- 1.5.1 火中取栗的TrueCar网站
- 1.5.2 数据对比赢得消费者信赖
- 1.5.3 对比分析小结
- 第2章 经典的相关分析与回归分析案例
- 2.1 相关回归综述
- 2.2 皮尔逊相关值——纽约市政府利用相关分析监控违法建筑
- 2.2.1 简约而不简单的消防检测系统
- 2.2.2 使用相关分析洞察60个变量的关系
- 2.2.3 相关分析小结
- 2.3 时间序列分析——人寿保险的可提费用预测
- 2.3.1 人寿保险公司和可提费用
- 2.3.2 使用四种时间序列回归预测模型解决问题
- 2.3.3 时间序列分析小结
- 2.4 线性回归分析——梅西百货公司的十二项大数据策略
- 2.4.1 从“一亿豪赌”说起的零售商困境
- 2.4.2 SAS公司帮助梅西百货构建模型
- 2.4.3 线性回归分析小结
- 2.5 Logistic回归分析——大面积流感爆发的预测分析
- 2.5.1 究竟谁才是流感预测算法之王
- 2.5.2 向Logistic算法中引入更多变量
- 2.5.3 Logistic回归分析小结
- 第3章 经典的降维数据分析案例
- 3.1 降维分析算法综述
- 3.2 粗糙集算法——协助希腊工业发展银行制定信贷政策
- 3.2.1 银行信贷政策的制定原则
- 3.2.2 粗糙集算法原理和应用
- 3.2.3 粗糙集算法小结
- 3.3 因子分析——基于李克特量表的应聘评价法
- 3.3.1 源于智力测试的因子分析
- 3.3.2 使用因子分析解构问卷
- 3.3.3 因子分析小结
- 3.4 最优尺度分析——直观评估消费者倾向的分析方法
- 3.4.1 市场调查问题催生的最优尺度分析
- 3.4.2 六种经典的最优尺度分析解读方法
- 3.4.3 最优尺度分析小结
- 3.5 PCA降维算法——智能人脸识别的应用与拓展
- 3.5.1 刷脸的时代来了
- 3.5.2 使用PCA算法完成降维工作
- 3.5.3 PCA算法小结
- 第4章 经典的模式识别案例
- 4.1 模式识别综述
- 4.2 图像分析——谷歌的超前自动驾驶技术
- 4.2.1 以安全的名义呼吁自动驾驶技术
- 4.2.2 快速成熟的无人驾驶技术
- 4.2.3 图像分析小结
- 4.3 遗传算法——经典的人力资源优化问题
- 4.3.1 使用有限资源实现利益最大化
- 4.3.2 遗传算法的计算过程
- 4.3.3 遗传算法小结
- 4.4 决策树分析——“沸腾时刻”准确判断用户健康水平
- 4.4.1 打造我国最大健身平台
- 4.4.2 信息增益和决策树
- 4.4.3 决策树小结
- 4.5 K均值聚类分析——HSE24通过为客户分类降低退货率
- 4.5.1 在电子商务市场快速扩张的HSE24
- 4.5.2 使用K均值聚类为客户分类
- 4.5.3 K均值聚类小结
- 第5章 经典的机器学习案例
- 5.1 机器学习综述
- 5.2 语义搜索——沃尔玛搜索引擎提升15%销售额
- 5.2.1 注重用户体验的沃尔玛公司
- 5.2.2 语义搜索引擎的底层技术和原理
- 5.2.3 语义搜索技术小结
- 5.3 顺序分析——搜狗输入法的智能纠错系统
- 5.3.1 搜狗输入法的王牌词库和智能算法
- 5.3.2 频繁树模式和顺序分析算法
- 5.3.3 顺序分析小结
- 5.4 文本分析——经典的垃圾邮件过滤系统
- 5.4.1 大数据时代需要文本分析工作
- 5.4.2 垃圾邮件过滤中的分词技术和词集模型
- 5.4.3 文本分析小结
- 5.5 协同过滤——构建个性化推荐系统的经典算法
- 5.5.1 协同过滤算法为什么这么流行
- 5.5.2 基于用户和基于产品的协同过滤
- 5.5.3 协同过滤算法小结
- 第6章 经典的深度学习案例
- 6.1 深度学习综述
- 6.2 支持向量机——乔布斯利用大数据对抗癌症
- 6.2.1 乔布斯和胰腺癌的八年抗战
- 6.2.2 医学统计学和支持向量机
- 6.2.3 支持向量机小结
- 6.3 感知器神经网络——最佳的房产价格预测算法
- 6.3.1 如何在我国预测房价
- 6.3.2 多层感知器和误差曲面
- 6.3.3 感知器神经网络小结
- 6.4 自组织神经网络——如何又快又好地解决旅行商问题
- 6.4.1 最优路径问题的典型模式和解决方法
- 6.4.2 自组织神经网络的拓扑结构和权值调整
- 6.4.3 自组织神经网络小结
- 6.5 RBM算法——为新闻报道智能分类
- 6.5.1 新闻报道智能分类的难与易
- 6.5.2 RBM算法的学习目标和学习方法
- 6.5.3 RBM算法小结
- 第7章 经典的数据挖掘案例
- 7.1 数据挖掘综述
- 7.2 判别分析——美国运通构建客户流失预测模型
- 7.2.1 美国运通公司的旧日辉煌
- 7.2.2 判别分析的假设条件和判别函数
- 7.2.3 判别分析小结
- 7.3 购物篮分析——找出零售业的最佳商品组合
- 7.3.1 名动天下的“啤酒和尿布”案例
- 7.3.2 购物篮分析的频繁模式
- 7.3.3 购物篮分析小结
- 7.4 马尔可夫链——准确预测客运市场占有率
- 7.4.1 复杂的客运市场系统
- 7.4.2 概率转移矩阵的求解方法
- 7.4.3 马尔可夫链小结
- 7.5 AdaBoost元算法——有效侦测欺诈交易的复合算法
- 7.5.1 弱分类器和强分类器之争
- 7.5.2 AdaBoost元算法的分类器构建方法
- 7.5.3 AdaBoost元算法小结
- 第8章 经典的商业智能分析案例
- 8.1 商业智能分析综述
- 8.2 KXEN分析软件——构建欧洲博彩业下注预测平台
- 8.2.1 现代博彩业背后的黑手
- 8.2.2 集体智慧和庄家赔率的联系
- 8.2.3 KXEN软件小结
- 8.3 数据废气再利用——物流公司数据成功用于评估客户信用
- 8.3.1 数据废气和黑暗数据的异同
- 8.3.2 论如何充分利用物流公司数据
- 8.3.3 数据废气再利用小结
- 8.4 必应预测——使用往期信息预测自然灾害
- 8.4.1 预测自然灾害的必要性
- 8.4.2 微软大数据预测的优与劣
- 8.4.3 必应预测小结
- 8.5 点球成金——助力NBA大数据分析的多种神秘软件
- 8.5.1 NBA的有效球员数据
- 8.5.2 有关点球成金的靠谱方法
- 8.5.3 点球成金小结