《Python贝叶斯分析》是由人民邮电出版社出版的一本关于Python方面的书籍,作者是Osvaldo、Martin(奥斯瓦尔多,主要介绍了关于Python、贝叶斯分析方面的知识内容,目前在Python类书籍综合评分为:7.4分。
书籍介绍
这书详细介绍了贝叶斯统计中的关键定义,及其将其运用于数据分析的方式 。这书选用编写程序测算的好用方式介绍了贝叶斯模型的基本,应用一些手工制作结构的统计数据和一部分简易的真正统计数据来表述和探寻贝叶斯框架结构中的关键定义,随后在这书涉及到的模型中,抽象性出了线形模型用以处理重归和归类难题,除此之外还详尽表述了混和模型和层次模型,并独立用一章探讨了怎样做模型挑选,还简易详细介绍了非参模型和高斯全过程。 这书全部的贝叶斯模型都用PyMC3保持。PyMC3是一个用以几率编写程序的Python库,其很多特点都会书中有详细介绍。在这书和PyMC3的协助下,读者将懂得保持、检查和拓展贝叶斯统计模型,进而处理一系列数据分析的难题。 从这书你将学得: 从好用的视角了解基础的贝叶斯定义; 学习培训怎样用PyMC3搭建概率模型; 把握检查和改动模型的专业技能; 运用层次模型的优点给模型添加构造; 对于不一样的数据分析难题,寻找适合的模型; 懂得在不确定性的状况下做模型挑选; 用回归分析预测分析连续变量,用逻辑回归或softmax做归类; 学习培训怎样从几率的视角思索,释放出来贝叶斯框架结构的协调能力与能量。
《Python贝叶斯分析》从实干和编写程序的视角解读了贝叶斯统计中的关键定义,并详细介绍了怎样使 用时髦的 PyMC3 来搭建概率模型。阅读文章这书,读者将把握保持、检查和拓展贝 叶斯统计分析模型,进而提高处理一系列数据分析难题的工作能力。这书不规定读者有任 何生物学层面的基本,但必须读者有应用 Python 编写程序层面的工作经验。
目录
- 第1章 概率思维——贝叶斯推断指南 1
- 1.1 以建模为中心的统计学 1
- 1.1.1 探索式数据分析 2
- 1.1.2 统计推断 3
- 1.2 概率与不确定性 4
- 1.2.1 概率分布 6
- 1.2.2 贝叶斯定理与统计推断 9
- 1.3 单参数推断 11
- 1.3.1 抛硬币问题 11
- 1.3.2 报告贝叶斯分析结果 20
- 1.3.3 模型注释和可视化 20
- 1.3.4 总结后验 21
- 1.4 后验预测检查 24
- 1.5 安装必要的 Python 库 24
- 1.6 总结 25
- 1.7 练习 25
- 第2章 概率编程——PyMC3 编程指南 27
- 2.1 概率编程 27
- 2.1.1 推断引擎 28
- 2.2 PyMC3 介绍 40
- 2.2.1 用计算的方法解决抛硬币问题 40
- 2.3 总结后验 47
- 2.3.1 基于后验的决策 48
- 2.4 总结 50
- 2.5 深入阅读 50
- 2.6 练习 51
- 第3章 多参和分层模型 53
- 3.1 冗余参数和边缘概率分布 53
- 3.2 随处可见的高斯分布 55
- 3.2.1 高斯推断 56
- 3.2.2 鲁棒推断 59
- 3.3 组间比较 64
- 3.3.1 “小费”数据集 65
- 3.3.2 Cohen’s d 68
- 3.3.3 概率优势 69
- 3.4 分层模型 69
- 3.4.1 收缩 72
- 3.5 总结 74
- 3.6 深入阅读 75
- 3.7 练习 75
- 第4章 利用线性回归模型理解并预测数据 77
- 4.1 一元线性回归 77
- 4.1.1 与机器学习的联系 78
- 4.1.2 线性回归模型的核心 78
- 4.1.3 线性模型与高自相关性 83
- 4.1.4 对后验进行解释和可视化 86
- 4.1.5 皮尔逊相关系数 89
- 4.2 鲁棒线性回归 95
- 4.3 分层线性回归 98
- 4.3.1 相关性与因果性 103
- 4.4 多项式回归 105
- 4.4.1 解释多项式回归的系数 107
- 4.4.2 多项式回归——终极模型? 108
- 4.5 多元线性回归 108
- 4.5.1 混淆变量和多余变量 112
- 4.5.2 多重共线性或相关性太高 115
- 4.5.3 隐藏的有效变量 117
- 4.5.4 增加相互作用 120
- 4.6 glm 模块 120
- 4.7 总结 121
- 4.8 深入阅读 121
- 4.9 练习 122
- 第5章 利用逻辑回归对结果进行分类 123
- 5.1 逻辑回归 123
- 5.1.1 逻辑回归模型 125
- 5.1.2 鸢尾花数据集 125
- 5.1.3 将逻辑回归模型应用到鸢尾花数据集 128
- 5.2 多元逻辑回归 131
- 5.2.1 决策边界 132
- 5.2.2 模型实现 132
- 5.2.3 处理相关变量 134
- 5.2.4 处理类别不平衡数据 135
- 5.2.5 如何解决类别不平衡的问题 137
- 5.2.6 解释逻辑回归的系数 137
- 5.2.7 广义线性模型 138
- 5.2.8 Softmax 回归或多项逻辑回归 139
- 5.3 判别式和生成式模型 142
- 5.4 总结 144
- 5.5 深入阅读 145
- 5.6 练习 145
- 第6章 模型比较 147
- 6.1 奥卡姆剃刀——简约性与准确性 147
- 6.1.1 参数太多导致过拟合 149
- 6.1.2 参数太少导致欠拟合 150
- 6.1.3 简洁性与准确性之间的平衡 151
- 6.2 正则先验 152
- 6.2.1 正则先验和多层模型 153
- 6.3 衡量预测准确性 153
- 6.3.1 交叉验证 154
- 6.3.2 信息量准则 155
- 6.3.3 用 PyMC3 计算信息量准则 158
- 6.3.4 解释和使用信息校准 162
- 6.3.5 后验预测检查 163
- 6.4 贝叶斯因子 164
- 6.4.1 类比信息量准则 166
- 6.4.2 计算贝叶斯因子 166
- 6.5 贝叶斯因子与信息量准则 169
- 6.6 总结 171
- 6.7 深入阅读 171
- 6.8 练习 171
- 第7章 混合模型 173
- 7.1 混合模型 173
- 7.1.1 如何构建混合模型 174
- 7.1.2 边缘高斯混合模型 180
- 7.1.3 混合模型与计数类型变量 181
- 7.1.4 鲁棒逻辑回归 187
- 7.2 基于模型的聚类 190
- 7.2.1 固定成分聚类 191
- 7.2.2 非固定成分聚类 191
- 7.3 连续混合模型 192
- 7.3.1 beta- 二项分布与负二项分布 192
- 7.3.2 t 分布 193
- 7.4 总结 193
- 7.5 深入阅读 194
- 7.6 练习 194
- 第8章 高斯过程 195
- 8.1 非参统计 195
- 8.2 基于核函数的模型 196
- 8.2.1 高斯核函数 196
- 8.2.2 核线性回归 197
- 8.2.3 过拟合与先验 202
- 8.3 高斯过程 202
- 8.3.1 构建协方差矩阵 203
- 8.3.2 根据高斯过程做预测 207
- 8.3.3 用 PyMC3 实现高斯过程 211
- 8.4 总结 215
- 8.5 深入阅读 216
- 8.6 练习 216