编辑推荐
贝叶斯方法正在变得越来越常见与重要,但是却没有太多可以借鉴的资料来帮助初学者。基于Allen Downey在大学讲授的本科课程,本书的计算方法能帮助你获得一个良好的开端。
使用已有的编程技巧学习和理解贝叶斯统计
处理估计、预测、决策分析、假设的证据、假设检验等问题
从简单的例子开始,包括硬币问题、M&Ms豆问题、《龙与地下城》勇士投骰子问题、彩弹游戏和冰球比赛问题
学习计算方法,解决诸如SAT分数含义、模拟肾肿瘤和人体微生物建模问题
内容简介
这本书帮助那些希望用数学工具解决实际问题的人们,仅有的要求可能就是懂一点概率知识和程序设计。而贝叶斯方法是一种常见的利用概率学知识去解决不确定性问题的数学方法,对于一个计算机专业的人士,应当熟悉其应用在诸如机器翻译,语音识别,垃圾邮件检测等常见的计算机问题领域。
可是本书实际上会远远扩大你的视野,即使不是一个计算机专业的人士,你也可以看到在战争环境下(二战德军坦克问题),法律问题上(肾肿瘤的假设验证),体育博彩领域(棕熊队和加人队NFL比赛问题)贝叶斯方法的威力。怎么从有限的信息判断德军装甲部队的规模,你所支持的球队有多大可能赢得冠军,在《龙与地下城》勇士中,你应当对游戏角色属性的*值有什么样的期望,甚至在普通的彩弹射击游戏中,拥有一些贝叶斯思维也能帮助到你提高游戏水平。
除此以外,本书在共计15章的篇幅中讨论了怎样解决十几个现实生活中的实际问题。在这些问题的解决过程中,作者还潜移默化的帮助读者形成了建模决策的方法论,建模误差和数值误差怎么取舍,怎样为具体问题建立数学模型,如何抓住问题中的主要矛盾(模型中的关键参数),再一步一步的优化或者验证模型的有效性或者局限性。在这个意义上,这本书又是一本关于数学建模的成功样本。
作者简介
作者:Allen Downey,是欧林工程学院的计算机教授,加州大学伯克利分校的计算机博士。他在韦斯利学院(Wellesley College)、科尔比学院(Colby College)和加州大学伯克利分校讲授计算机科学课程。他也是O’Reilly出版的Think Stats和Think Python图书的作者。
译者:许杨毅,新浪网系统架构师,技术保障部总监,毕业于湖南大学,15年互联网工作经验。
目录
- 第1章 贝叶斯定理
- 1.1 条件概率
- 1.2 联合概率
- 1.3 曲奇饼问题
- 1.4 贝叶斯定理
- 1.5 历时诠释
- 1.6 M&M豆问题
- 1.7 Monty Hall难题
- 1.8 讨论
- 第2章 统计计算
- 2.1 分布
- 2.2 曲奇饼问题
- 2.3 贝叶斯框架
- 2.4 Monty Hall难题
- 2.5 封装框架
- 2.6 M&M豆问题
- 2.7 讨论
- 2.8 练习
- 第3章 估计
- 3.1 骰子问题
- 3.2 火车头问题
- 3.3 怎样看待先验概率?
- 3.4 其他先验概率
- 3.5 置信区间
- 3.6 累积分布函数
- 3.7 德军坦克问题
- 3.8 讨论
- 3.9 练习
- 第4章 估计进阶
- 4.1 欧元问题
- 4.2 后验概率的概述
- 4.3 先验概率的湮没
- 4.4 优化
- 4.5 Beta分布
- 4.6 讨论
- 4.7 练习
- 第5章 胜率和加数
- 5.1 胜率
- 5.2 贝叶斯定理的胜率形式
- 5.3 奥利弗的血迹
- 5.4 加数
- 5.5 最大化
- 5.6 混合分布
- 5.7 讨论
- 第6章 决策分析
- 6.1 “正确的价格”问题
- 6.2 先验概率
- 6.3 概率密度函数
- 6.4 PDF的表示
- 6.5 选手建模
- 6.6 似然度
- 6.7 更新
- 6.8 最优出价
- 6.9 讨论
- 第7章 预测
- 7.1 波士顿棕熊队问题
- 7.2 泊松过程
- 7.3 后验
- 7.4 进球分布
- 7.5 获胜的概率
- 7.6 突然死亡法则
- 7.7 讨论
- 7.8 练习
- 第8章 观察者的偏差
- 8.1 红线问题
- 8.2 模型
- 8.3 等待时间
- 8.4 预测等待时间
- 8.5 估计到达率
- 8.6 消除不确定性
- 8.7 决策分析
- 8.8 讨论
- 8.9 练习
- 第9章 二维问题
- 9.1 彩弹
- 9.2 Suite对象
- 9.3 三角学
- 9.4 似然度
- 9.5 联合分布
- 9.6 条件分布
- 9.7 置信区间
- 9.8 讨论
- 9.9 练习
- 第10章 贝叶斯近似计算
- 10.1 变异性假说
- 10.2 均值和标准差
- 10.3 更新
- 10.4 CV的后验分布
- 10.5 数据下溢
- 10.6 对数似然
- 10.7 一个小的优化
- 10.8 ABC(近似贝叶斯计算)
- 10.9 估计的可靠性
- 10.10 谁的变异性更大?
- 10.11 讨论
- 10.12 练习
- 第11章 假设检验
- 11.1 回到欧元问题
- 11.2 来一个公平的对比
- 11.3 三角前验
- 11.4 讨论
- 11.5 练习
- 第12章 证据
- 12.1 解读SAT成绩
- 12.2 比例得分SAT
- 12.3 先验
- 12.4 后验
- 12.5 一个更好的模型
- 12.6 校准
- 12.7 效率的后验分布
- 12.8 预测分布
- 12.9 讨论
- 第13章 模拟
- 13.1 肾肿瘤的问题
- 13.2 一个简化模型
- 13.3 更普遍的模型
- 13.4 实现
- 13.5 缓存联合分布
- 13.6 条件分布
- 13.7 序列相关性
- 13.8 讨论
- 第14章 层次化模型
- 14.1 盖革计数器问题
- 14.2 从简单的开始
- 14.3 分层模型
- 14.4 一个小优化
- 14.5 抽取后验
- 14.6 讨论
- 14.7 练习
- 第15章 处理多维问题
- 15.1 脐部细菌
- 15.2 狮子,老虎和熊
- 15.3 分层版本
- 15.4 随机抽样
- 15.5 优化
- 15.6 堆叠的层次结构
- 15.7 另一个问题
- 15.8 还有工作要做
- 15.9 肚脐数据
- 15.10 预测分布
- 15.11 联合后验
- 15.12 覆盖
- 15.13 讨论