目前已有很多Python和数据可视化方面的书。然而,对于有一定Python知识储备的人来说,几乎很少有把两者内容结合在一起的书值得推荐。有关简化代码、重复使用的小生境(niche)技术的讨论更是少之又少。对于有强烈学习兴趣的Python开发人员,本书将提供一系列获得分析结果和产生惊人可视化效果的方法。
封面图
目录
- 译者序
- 前言
- 第1章数据可视化概念框架 1
- 1.1数据、信息、知识和观点 2
- 1.1.1数据 2
- 1.1.2信息 2
- 1.1.3知识 3
- 1.1.4数据分析和观点 3
- 1.2数据转换 4
- 1.2.1数据转换为信息 4
- 1.2.2信息转换为知识 7
- 1.2.3知识转换为观点 7
- 1.3数据可视化历史 8
- 1.4可视化如何帮助决策 10
- 1.4.1可视化适用于哪里 11
- 1.4.2如今的数据可视化 12
- 1.5可视化图像 15
- 1.5.1条形图和饼图 19
- 1.5.2箱线图 22
- 1.5.3散点图和气泡图 23
- 1.5.4核密度估计图 26
- 1.6总结 29
- 第2章数据分析与可视化 30
- 2.1为什么可视化需要规划 31
- 2.2Ebola案例 31
- 2.3体育案例 37
- 2.4用数据编写有趣的故事 47
- 2.4.1为什么故事如此重要 47
- 2.4.2以读者驱动为导向的故事 47
- 2.4.3以作者驱动为导向的故事 53
- 2.5感知与表达方法 55
- 2.6一些最好的可视化实践 57
- 2.6.1比较和排名 57
- 2.6.2相关性 58
- 2.6.3分布 59
- 2.6.4位置定位或地理数据 61
- 2.6.5局部到整体的关系 61
- 2.6.6随时间的变化趋势 62
- 2.7Python中的可视化工具 62
- 2.8交互式可视化 64
- 2.8.1事件监听器 64
- 2.8.2布局设计 65
- 2.9总结 67
- 第3章开始使用Python IDE 69
- 3.1Python中的IDE工具 70
- 3.1.1Python 3.x和Python 2.7 70
- 3.1.2交互式工具类型 70
- 3.1.3Python IDE类型 72
- 3.2Anaconda可视化绘图 83
- 3.2.1表面三维图 83
- 3.2.2方形图 85
- 3.3交互式可视化软件包 89
- 3.3.1Bokeh 89
- 3.3.2VisPy 90
- 3.4总结 91
- 第4章数值计算和交互式绘图 92
- 4.1NumPy、SciPy和MKL函数 93
- 4.1.1NumPy 93
- 4.1.2SciPy 99
- 4.1.3MKL函数 105
- 4.1.4Python的性能 106
- 4.2标量选择 106
- 4.3切片 107
- 4.4数组索引 108
- 4.4.1数值索引 108
- 4.4.2逻辑索引 109
- 4.5其他数据结构 110
- 4.5.1栈 110
- 4.5.2元组 111
- 4.5.3集合 112
- 4.5.4队列 113
- 4.5.5字典 114
- 4.5.6字典的矩阵表示 115
- 4.5.7Trie树 120
- 4.6利用matplotlib进行可视化 121
- 4.6.1词云 122
- 4.6.2安装词云 122
- 4.6.3词云的输入 124
- 4.6.4绘制股票价格图 129
- 4.7体育运动中的可视化案例 136
- 4.8总结 140
- 第5章金融和统计模型 141
- 5.1确定性模型 142
- 5.2随机性模型 150
- 5.2.1蒙特卡洛模拟 150
- 5.2.2投资组合估值 168
- 5.2.3模拟模型 170
- 5.2.4几何布朗运动模拟 170
- 5.2.5基于扩散模拟 173
- 5.3阈值模型 175
- 5.4统计与机器学习综述 179
- 5.4.1k-最近邻算法 179
- 5.4.2广义线性模型 181
- 5.5创建动画和交互图 184
- 5.6总结 188
- 第6章统计与机器学习 189
- 6.1分类方法 190
- 6.1.1理解线性回归 191
- 6.1.2线性回归 193
- 6.1.3决策树 196
- 6.1.4贝叶斯理论 199
- 6.1.5朴素贝叶斯分类器 200
- 6.1.6用TextBlob构建朴素贝叶斯分类器 202
- 6.1.7用词云观察积极情绪 206
- 6.2k-最近邻 208
- 6.3逻辑斯谛回归 211
- 6.4支持向量机 214
- 6.5主成分分析 216
- 6.6 k-均值聚类 220
- 6.7总结 223
- 第7章生物信息学、遗传学和网络模型 224
- 7.1有向图和多重图 225
- 7.1.1存储图表数据 225
- 7.1.2图表展示 227
- 7.2图的聚集系数 235
- 7.3社交网络分析 238
- 7.4平面图测试 240
- 7.5有向无环图测试 242
- 7.6最大流量和最小切割 244
- 7.7遗传编程示例 245
- 7.8随机区组模型 247
- 7.9总结 250
- 第8章高级可视化 252
- 8.1计算机模拟 253
- 8.1.1Python的random包 253
- 8.1.2SciPy的random函数 254
- 8.1.3模拟示例 255
- 8.1.4信号处理 258
- 8.1.5动画制作 261
- 8.1.6利用HTML5进行可视化 263
- 8.1.7Julia和Python有什么区别 267
- 8.1.8用D3.js进行可视化 267
- 8.1.9仪表盘 268
- 8.2总结 269
- 附录继续探索可视化 270