大数据可视化容许运用图型、图象处理、计算机视觉及其操作界面,根据表述、模型及其对立体式、表层、特性及其动漫的显示信息,对统计数据多方面数据可视化表述,大数据可视化技术性在中国销售市场长期性看中,而目前中国有关书藉相对性偏少,这书挑选这一方位开展系统软件基本科学研究,期待为这些在想此行业有一定的发展趋势的用户出示学习培训协助。在这书中,人们最先详细介绍大数据可视化的某些基础知识,接着重中之重详细介绍应用Tableau、SAS及SPSS Modeler的数据可视化页面开展数据统计分析与大数据挖掘的方式 。
目录
- 序 言 1
- 第1部分 11
- 数据可视化篇 11
- 1.1 数据可视化 12
- 1.1.1 Tableau 13
- 1.1.2 QlikView 15
- 1.1.3 Power BI 15
- 1.2 可视化数据挖掘 16
- 1.2.1 IBM SPSS Modeler 16
- 1.2.2 Intelligent Miner 17
- 1.2.3 SAS Enterprise Miner 18
- 2.1 软件页面简介 20
- 2.1.1 开始页面 21
- 2.1.2 数据源页面 23
- 2.1.3 工作簿页面 24
- 2.2 数据类型 25
- 2.2.1 主要数据类型 25
- 2.2.2 更改数据类型 26
- 2.3 运算符及优先级 28
- 2.3.1 算术运算符 28
- 2.3.2 逻辑运算符 29
- 2.3.3 比较运算符 29
- 2.3.4 运算符优先级 29
- 2.4 软件安装 30
- 2.4.1软件下载 30
- 2.4.2安装步骤 31
- 2.4.3软件激活 35
- 2.5 文件类型 37
- 3.1连接到文件 39
- 3.1.1 Excel文件 39
- 3.1.2 文本文件 41
- 3.1.3 Access 43
- 3.1.4 JSON文件 45
- 3.1.5 PDF文件 47
- 3.1.6 空间文件 49
- 3.1.7 统计文件 51
- 3.1.8 其他文件 53
- 3.2连接到数据库 54
- 3.2.1Tableau Server 54
- 3.2.2 SQL Server 55
- 3.2.3 MySQL 56
- 3.2.4 Oracle 58
- 3.2.5 Amazon Redshift 59
- 3.2.6 更多数据库 61
- 4.1维度和度量 64
- 4.1.1 维度 64
- 4.1.2 度量 66
- 4.2连续和离散 67
- 4.2.1 连续字段 67
- 4.2.2 离散字段 68
- 4.3工作区操作 68
- 4.3.1“数据”窗格 69
- 4.3.2“分析”窗格 71
- 4.3.3工具栏 71
- 4.3.4状态栏 72
- 4.3.5卡和功能区 73
- 4.4工作表操作 74
- 4.4.1创建工作表 75
- 4.4.2复制工作表 75
- 4.4.3导出工作表 77
- 4.4.4删除工作表 77
- 4.5Tableau高级应用 78
- 4.5.1表计算 78
- 4.5.2创建字段 81
- 4.5.3创建参数 83
- 4.5.4聚合计算 90
- 4.5.5缺失值处理 92
- 5.1单变量图形 95
- 5.1.1条形图 95
- 5.1.2饼图 98
- 5.1.3直方图 100
- 5.1.4折线图 101
- 5.2 多变量图形 103
- 5.2.1散点图 103
- 5.2.2甘特图 105
- 5.3 地图 106
- 5.3.1设置角色 106
- 5.3.2标记地图 108
- 5.3.3添加字段信息 108
- 5.3.4设置地图选项 109
- 5.3.5创建分布图 112
- 5.3.6自定义地图 112
- 第2部分 114
- 可视化数据挖掘篇 114
- 6.1 软件简介 115
- 6.1.1 软件历史 115
- 6.1.2 软件界面 117
- 6.1.3 软件特点 123
- 6.2 算法及功能 124
- 6.2.1 软件算法 124
- 6.2.2 软件功能 125
- 6.3 软件安装及启动 127
- 6.3.1 软件安装 127
- 6.3.2 授权许可 131
- 6.3.3 启动软件 134
- 7.1 业务理解 137
- 7.2 数据理解 138
- 7.3 数据准备 138
- 7.4 建立模型 140
- 7.5 评估模型 140
- 7.6 应用模型 141
- 8.1 连接到文件 142
- 8.1.1 Excel文件 142
- 8.1.2 变量文件 143
- 8.1.3 固定文件 145
- 8.1.4 SAS文件 146
- 8.1.5 Statistics文件 146
- 8.2 连接到数据库 147
- 9.1 数据流操作 151
- 9.1.1 生成数据流 151
- 9.1.2 添加和删除节点 151
- 9.1.3 连接数据流 152
- 9.1.4 修改连接节点 153
- 9.1.5 执行数据流 155
- 9.2 图形制作 155
- 9.2.1 散点图 155
- 9.2.2 直方图 157
- 9.2.3 网络图 158
- 9.2.4 评估图 160
- 第3部分 162
- 案例实战篇 162
- 10.1 建模思路 164
- 10.2 Logistic回归 165
- 10.3 业务理解 167
- 10.4 数据理解 168
- 10.5 数据准备 171
- 10.6 建立模型 173
- 10.6.1 模型参数设置 173
- 10.6.2 模型运行结果 183
- 10.7 模型评估 187
- 10.7.1 模型精确度 187
- 10.7.2 模型拟合度 187
- 10.8 模型应用 189
- 10.9 小结 192
- 11.1 建模思路 194
- 11.2 时间序列模型 195
- 11.3 业务理解 196
- 11.4 数据理解 197
- 11.5 数据准备 198
- 11.6 建立模型 200
- 11.6.1模型参数设置 200
- 11.6.2 模型运行结果 216
- 11.7 模型评估 218
- 11.8 模型应用 220
- 11.9 小结 221
- 12.1 建模思路 223
- 12.2 聚类模型 224
- 12.3 业务理解 225
- 12.4 数据理解 226
- 12.5 数据准备 228
- 12.6 建立模型 230
- 12.6.1模型参数设置 230
- 12.6.2 模型运行结果 233
- 12.7 模型评估 236
- 12.8 模型应用 239
- 12.9 小结 241
- 13.1 建模思路 243
- 13.2 判别分析 244
- 13.3 业务理解 245
- 13.4 数据理解 246
- 13.5 数据准备 248
- 13.6 建立模型 249
- 13.6.1 模型参数设置 249
- 13.6.2模型运行结果 257
- 13.7 模型评估 262
- 13.8 模型应用 263
- 13.9 小结 265
- 14.1 建模思路 268
- 14.2 神经网络模型 269
- 14.2.1 神经元 270
- 14.2.2 多层感知器 272
- 14.2.3 径向基函数 273
- 14.3 业务理解 275
- 14.4 数据理解 276
- 14.5 数据准备 278
- 14.6 建立模型 280
- 14.6.1 模型参数设置 280
- 14.6.2模型运行结果 287
- 14.7 模型评估 291
- 14.8 模型应用 292
- 14.9 小结 294
- 15.1 建模思路 296
- 15.2 决策树模型 297
- 15.3 业务理解 299
- 15.4 数据理解 300
- 15.5 数据准备 303
- 15.6 建立模型 306
- 15.6.1 模型参数设置 306
- 15.6.2 模型运行结果 316
- 15.7 模型评估 318
- 15.7.1 模型精确度 318
- 15.7.2 模型拟合度 318
- 15.8 模型应用 320
- 15.9 小结 323
- 附录A 324
- 配置MySQL ODBC数据源 324
- A1 添加数据源管理器 324
- A2 选择相应的驱动程序 324
- A3 连接数据库服务器 325
- 附录B 327
- Tableau重要函数 327
- B1 数字函数 327
- B2 字符串函数 329
- B3 日期函数 331
- B4 类型转换 334
- B5 逻辑函数 335
- B6 聚合函数 337
- B7 直通函数 338
- B8 用户函数 340
- B9 表计算函数 341
- B10 其他函数 346
- 附录C 349
- SPSS Modele函数 349
- C1 信息函数 349
- C2 转换函数 350
- C3 比较函数 351
- C4 逻辑函数 352
- C5 数值函数 352
- C6 三角函数 353
- C7 概率函数 354
- C8 位元整数运算 354
- C9 随机函数 355
- C10 字符串函数 356
- C11 日期和时间函数 359
- C12 序列函数 362
- C13 全局函数 365
- C14 空值和Null值处理函数 366
- C15 特殊函数 366