编辑推荐
大数据革命风起云涌。数据分析成了每一波舞者的杀手。统计思维是数据分析和数据挖掘的基础。
每个程序员都要有统计思维,看到这本书,你比别人领先一步。这是一本极其独特的统计思维入门书。
独特的编程视角。对于概率统计的主要概念,作者给出了开源代码示例,其新颖独特的解释方法可以让程序员对概率统计有更深的理解。
幽默风趣的示例。你一直无法理解蒙蒂霍尔的问题吗?庞加莱是如何发现面包师的企图的?作者引用经典问题来帮助你打开统计思维。
公共开源数据。把它带到美国全国家庭成长调查(NSFG)和行为危险因素监测系统(BRFSS)数据,重用引用代码,并使您自己的代码立即运行。
目录
- 前言
- 第1章程序员的统计思维
- 1.1第一个孩子出生晚吗
- 1.2统计方法
- 1.3全国家庭成长调查
- 1.4表和记录
- 1.5显著性
- 1.6术语
- 第2章描述性统计量
- 2.1均值和平均值
- 2.2方差
- 2.3分布
- 2.4直方图的表示
- 2.5绘制直方图
- 2.6表示概率质量函数
- 2.7绘制概率质量函数
- 2.8异常值
- 2.9其他可视化方法
- 2.10相对风险
- 2.11条件概率
- 2.12汇报结果
- 2.13术语表
- 第3章累积分布函数
- 3.1选课人数之谜
- 3.2PMF的不足
- 3.3百分位数
- 3.4累积分布函数
- 3.5CDF的表示
- 3.6回到调查数据
- 3.7条件分布
- 3.8随机数
- 3.9汇总统计量小结
- 3.10术语表
- 第4章连续分布
- 4.1指数分布
- 4.2帕累托分布
- 4.3正态分布
- 4.4正态概率图
- 4.5对数正态分布
- 4.6为什么需要模型
- 4.7生成随机数
- 4.8术语
- 第5章概率
- 5.1概率法则
- 5.2蒙提霍尔问题
- 5.3庞加莱
- 5.4其他概率法则
- 5.5二项分布
- 5.6连胜和手感
- 5.7贝叶斯定理
- 5.8术语
- 第6章分布的运算
- 6.1偏度
- 6.2随机变量
- 6.3概率密度函数
- 6.4卷积
- 6.5正态分布的性质
- 6.6中心极限定理
- 6.7分布函数之间的关系框架
- 6.8术语表
- 第7章假设检验
- 7.1均值差异的检验
- 7.2阈值的选择
- 7.3效应的定义
- 7.4解释统计检验结果
- 7.5交叉验证
- 7.6报道贝叶斯概率的结果
- 7.7卡方检验
- 7.8高效再抽样
- 7.9功效
- 7.10术语
- 第8章估计
- 8.1关于估计的游戏
- 8.2方差估计
- 8.3误差
- 8.4指数分布
- 8.5置信区间
- 8.6贝叶斯估计
- 8.7贝叶斯估计的实现
- 8.8删失数据
- 8.9火车头问题
- 8.10术语
- 第9章相关性
- 9.1标准分数
- 9.2协方差
- 9.3相关性
- 9.4用pyplot画散点图
- 9.5斯皮尔曼秩相关
- 9.6最小二乘拟合
- 9.7拟合优度
- 9.8相关性和因果关系
- 9.9术语
- 作者及封面简介
- 索引