Python3智能数据分析快速入门
(1)深度学习等AI技术性驱动器的智能化数据统计分析是数据统计分析制造行业的将来发展前景,全部数据分析师都应当关心。
(2)创作者从业数据统计分析与发掘10多年,对Python等各种各样数据统计分析技术性和小工具都十分了解,在智能化数据统计分析行业也积淀了很多的工作经验。
(3)这书朝向零Python基本和零AI基本的用户,选萃了*精粹的知识结构图,包括很多实例编码,具体指导用户迅速新手入门。这书以Python有关技术性为小工具,解读了怎样应用场景深度学习等AI技术性开展智能化数据统计分析。
创作者在Python大数据挖掘与剖析行业有10多年的工作经历,对AI技术性驱动器的智能化数据统计分析有十分深层次的科学研究。这书朝向沒有Python代码和AI技术性基本的用户,循序渐进地出示了系统软件的Python智能化数据统计分析的技术性和方式 。
全书共9章,从逻辑性上可分成2个一部分:
第壹一部分:Python代码(1~4章)
这些详解了从业Python程序编写必须把握的各种各样基本知识,包含开发工具的构建与配备,及其各种各样英语的语法和普遍Python库的基本原理和使用说明。
其次一部分:智能化数据统计分析(第5~9章)
这些对Python的数值分析库NumPy、数据处理方法库pandas、绘图片库Matplotlib/Seaborn/Bokeh、深度学习与数据统计分析模型库scikit-lear等开展了详尽地解读,包括统计数据载入、数据预处理、实体模型搭建、实体模型点评、結果数据可视化等全部数据统计分析的全过程,能具体指导用户迅速新手入门Python智能化数据统计分析。
目录
- 前言
- 第1章 Python概述 1
- 1.1 Python语言介绍 1
- 1.1.1 Python的发展史 1
- 1.1.2 Python特性 2
- 1.1.3 Python应用领域 3
- 1.1.4 Python机器学习优势 6
- 1.2 Python环境配置 8
- 1.2.1 Python 2还是Python 3 8
- 1.2.2 Anaconda简介 8
- 1.2.3 安装Anaconda 3 9
- 1.3 Python的解释器与IDE 12
- 1.3.1 Python的解释器 13
- 1.3.2 Python各IDE比较 13
- 1.3.3 PyCharm的安装与使用 16
- 1.3.4 Jupyter Notebook的使用 26
- 小结 32
- 课后习题 33
- 第2章 Python基础知识 34
- 2.1 固定语法 34
- 2.1.1 声明与注释 34
- 2.1.2 缩进与多行语句 36
- 2.1.3 保留字符与赋值 38
- 2.2 运算符 40
- 2.2.1 算术运算符 40
- 2.2.2 赋值运算符 41
- 2.2.3 比较运算符 43
- 2.2.4 逻辑运算符 44
- 2.2.5 按位运算符 44
- 2.2.6 身份运算符 45
- 2.2.7 成员运算符 46
- 2.2.8 运算符优先级 47
- 2.3 数据类型 48
- 2.3.1 基础数据类型 48
- 2.3.2 复合数据类型 55
- 2.4 Python I/O 63
- 2.4.1 input与print 64
- 2.4.2 文件I/O 67
- 小结 70
- 课后习题 70
- 第3章 控制语句 72
- 3.1 条件语句 72
- 3.1.1 if、elif与else 73
- 3.1.2 try、except与else 76
- 3.2 循环语句 80
- 3.2.1 for 81
- 3.2.2 while 83
- 3.2.3 break、continue与pass 85
- 3.2.4 列表推导式 89
- 小结 91
- 课后习题 91
- 第4章 函数与对象 94
- 4.1 函数 94
- 4.1.1 内置函数 94
- 4.1.2 自定义函数 101
- 4.1.3 匿名函数 107
- 4.2 对象 109
- 4.2.1 面向对象简介 109
- 4.2.2 属性与方法 110
- 4.2.3 装饰器 116
- 4.2.4 继承和多态 119
- 4.3 Python常用库安装 126
- 4.3.1 第三方库安装 126
- 4.3.2 第三方库导入 130
- 4.3.3 第三方库创建 131
- 小结 132
- 课后习题 133
- 第5章 NumPy数值计算 135
- 5.1 ndarray创建与索引 135
- 5.1.1 创建ndarray对象 135
- 5.1.2 ndarray的索引与切片 142
- 5.2 ndarray的基础操作 145
- 5.2.1 变换ndarray的形态 145
- 5.2.2 排序与搜索 151
- 5.2.3 字符串操作 156
- 5.3 ufunc 159
- 5.3.1 ufunc的广播机制 159
- 5.3.2 常用ufunc 160
- 5.4 matrix与线性代数 169
- 5.4.1 创建NumPy矩阵 169
- 5.4.2 矩阵的属性和基本运算 170
- 5.4.3 线性代数运算 172
- 5.5 NumPy文件读写 175
- 5.5.1 二进制文件读写 175
- 5.5.2 文件列表形式数据读写 178
- 小结 180
- 课后习题 180
- 第6章 pandas基础 182
- 6.1 pandas常用类 182
- 6.1.1 Series 182
- 6.1.2 DataFrame 187
- 6.1.3 Index 191
- 6.2 DataFrame基础操作 193
- 6.2.1 索引 193
- 6.2.2 排序 201
- 6.2.3 合并 204
- 6.3 其他数据类型操作 210
- 6.3.1 时间操作 210
- 6.3.2 文本操作 220
- 6.3.3 category操作 223
- 小结 227
- 课后习题 227
- 第7章 pandas进阶 229
- 7.1 数据读取与写入 229
- 7.1.1 CSV 229
- 7.1.2 Excel 231
- 7.1.3 数据库 233
- 7.2 DataFrame进阶 235
- 7.2.1 统计分析 235
- 7.2.2 分组运算 242
- 7.2.3 透视表和交叉表 248
- 7.3 数据准备 250
- 7.3.1 缺失值处理 251
- 7.3.2 重复数据处理 255
- 7.3.3 连续特征离散化处理 256
- 7.3.4 哑变量处理 259
- 小结 260
- 课后习题 260
- 第8章 绘图 263
- 8.1 Matplotlib绘图基础 263
- 8.1.1 编码风格 263
- 8.1.2 动态rc参数 267
- 8.1.3 散点图 273
- 8.1.4 折线图 276
- 8.1.5 饼图 278
- 8.1.6 直方图与条形图 280
- 8.1.7 箱线图 282
- 8.2 Seaborn进阶绘图 285
- 8.2.1 Seaborn基础 285
- 8.2.2 关系图 301
- 8.2.3 分类图 311
- 8.2.4 分布图 329
- 8.2.5 回归图 334
- 8.2.6 矩阵图 341
- 8.2.7 网格图 345
- 8.3 Bokeh交互式绘图 356
- 8.3.1 基本构成与语法 356
- 8.3.2 常见图形绘制 370
- 8.3.3 导出与嵌入 375
- 8.3.4 运行Bokeh应用程序 379
- 小结 381
- 习题 381
- 第9章 scikit-learn 383
- 9.1 数据准备 383
- 9.1.1 标准化 383
- 9.1.2 归一化 387
- 9.1.3 二值化 388
- 9.1.4 独热编码 389
- 9.2 降维 391
- 9.2.1 PCA 392
- 9.2.2 随机投影 396
- 9.2.3 字典学习 402
- 9.2.4 独立成分分析 408
- 9.2.5 非负矩阵分解 412
- 9.2.6 线性判别分析 416
- 9.3 聚类 420
- 9.3.1 K-Means 421
- 9.3.2 层次聚类 424
- 9.3.3 DBSCAN 427
- 9.3.4 高斯混合模型 430
- 9.4 分类 434
- 9.4.1 Logistic回归 435
- 9.4.2 支持向量机 439
- 9.4.3 决策树 443
- 9.4.4 最近邻 447
- 9.4.5 朴素贝叶斯 450
- 9.4.6 随机森林 452
- 9.4.7 多层感知机 456
- 9.5 回归 460
- 9.5.1 最小二乘回归 461
- 9.5.2 岭回归 464
- 9.5.3 Lasso回归 466
- 9.5.4 决策树回归 468
- 9.5.5 随机森林回归 471
- 9.5.6 多层感知机回归 473
- 9.6 模型选择 476
- 9.6.1 数据集划分 476
- 9.6.2 交叉验证 478
- 9.6.3 自动调参 479
- 9.6.4 模型评估 481
- 小结 486
- 课后习题 487