《智能数据分析:入门、实战与平台构建》是由机械工业出版社出版的一本关于数据分析方面的书籍,作者是陈雪莹,主要介绍了关于数据分析、数据分析入门方面的知识内容,目前在数据分析类书籍综合评分为:8.4分。
书籍介绍
内容简介
本书将以智能数据分析为主线,分三个部分进行介绍:第一部分将通过对数据分析发展历程及趋势的介绍,让读者通过浅显易懂的方式快速了解数据智能分析及其发展趋势;第二部分将详细讲述笔者通过经验总结的数据智能分析的思路、方法与技巧,帮读者在脑中建立起清晰的智能分析思路及分析体系;第三部分将通过各行业案例的介绍,侧重说明企业数据智能分析的价值体现。
目录
- 前言
- 第一部分基础知识
- 第1章初识智能数据分析2
- 1.1智能数据分析的定义2
- 1.2基础理论体系3
- 1.2.1DIKW3
- 1.2.2CRISP-DM6
- 1.3数据分析的发展8
- 1.3.1分析思路的演进9
- 1.3.2分析工具的发展11
- 1.3.3组织体系的变革13
- 1.3.4未来趋势15
- 1.4本章小结18
- 第2章智能数据分析基本知识19
- 2.1数据分析之“痛”19
- 2.1.1数据找不到19
- 2.1.2数据质量差20
- 2.1.3分析手段旧21
- 2.1.4分析效率低21
- 2.1.5数据杂乱21
- 2.2数据分析之“悟”21
- 2.2.1数据“收纳”21
- 2.2.2寻找“好数据”25
- 2.2.3向“数据科学家”看齐26
- 2.3数据分析之“层”27
- 2.3.1描述性分析29
- 2.3.2诊断性分析34
- 2.3.3预测性分析38
- 2.3.4指导性分析39
- 2.4数据分析之“法”41
- 2.4.1分析思维41
- 2.4.2分析方法42
- 2.5本章小结43
- 第二部分理论方法
- 第3章数据资产管理46
- 3.1认识数据资产管理47
- 3.1.1发展历程47
- 3.1.2基本内容48
- 3.2数据之“管”50
- 3.2.1数据的4个层次50
- 3.2.2元数据52
- 3.2.3数据标签53
- 3.2.4主数据55
- 3.3数据之“存”57
- 3.3.1数据湖58
- 3.3.2数据仓库59
- 3.3.3数据集市60
- 3.4数据之“算”61
- 3.4.1数据清洗62
- 3.4.2数据加工63
- 3.4.3数据ETL65
- 3.5数据之“规”65
- 3.5.1数据标准65
- 3.5.2规范制度67
- 3.6数据之“治”67
- 3.6.1高层负责67
- 3.6.2组织保障68
- 3.6.3机制建立68
- 3.7本章小结69
- 第4章数据统计及数据挖掘70
- 4.1相关基础概念70
- 4.2描述性统计分析方法71
- 4.2.1常规统计72
- 4.2.2集中趋势统计72
- 4.2.3离散趋势统计76
- 4.3诊断性分析方法77
- 4.3.1因素分析法78
- 4.3.2上卷与下钻78
- 4.3.3关联分析79
- 4.4预测性分析方法80
- 4.4.1线性回归81
- 4.4.2逻辑回归82
- 4.4.3K-Means算法84
- 4.5指导性分析方法85
- 4.5.1决策树85
- 4.5.2随机森林87
- 4.5.3协同过滤88
- 4.5.4神经网络90
- 4.6本章小结93
- 第5章数据可视化分析94
- 5.1可视化简史94
- 5.1.118世纪以前:图形符号94
- 5.1.218~19世纪:统计图形从萌芽到繁盛95
- 5.1.320世纪:多维信息图形规范化98
- 5.1.421世纪以来:交互可视化99
- 5.2可视化图表基础理论100
- 5.2.1比较分析101
- 5.2.2构成分析106
- 5.2.3分布分析110
- 5.2.4关联分析116
- 5.3“好图表”和“坏图表”119
- 5.3.1好看119
- 5.3.2好懂123
- 5.3.3好用125
- 5.4“好报告”和“坏报告”127
- 5.4.1布局合理129
- 5.4.2色彩统一133
- 5.4.3字体、字号协调133
- 5.5可视化案例133
- 5.6本章小结136
- 第三部分平台实战
- 第6章企业级智能数据分析平台搭建138
- 6.1构建数据分析“生态系统”138
- 6.1.1数据生态的范畴138
- 6.1.2构建有效的组织体系141
- 6.1.3营造良好的数据文化氛围145
- 6.2搭建智能数据分析平台149
- 6.2.1平台愿景150
- 6.2.2基础设施151
- 6.2.3建设内容155
- 6.3本章小结160
- 第7章企业级数据分析平台必备的能力161
- 7.1多源化数据汇聚能力162
- 7.1.1批式数据接入能力163
- 7.1.2实时数据感知能力164
- 7.2体系化指标管理能力168
- 7.2.1指标体系构建能力169
- 7.2.2指标计算及关系管理能力170
- 7.3可视化数据准备能力173
- 7.3.1数据清洗及加工能力173
- 7.3.2数据链路管理及更新能力179
- 7.4自助式分析展示能力179
- 7.4.1多维度图表分析展示能力179
- 7.4.2多表头表格分析展示能力185
- 7.4.3出具多样化分析报告能力187
- 7.5可管理的模型构建能力190
- 7.5.1数据模型构建能力191
- 7.5.2指标模型构建能力191
- 7.5.3算法模型构建能力192
- 7.5.4展示模型构建能力193
- 7.6智能化搜索推荐能力193
- 7.6.1智能数据搜索推荐能力194
- 7.6.2智能问答语义解析能力197
- 7.6.3智能文本生成能力200
- 7.7本章小结201
- 第8章智能数据分析平台应用案例及实践202
- 8.1政府宏观经济大数据仓库202
- 8.1.1宏观经济数据汇聚203
- 8.1.2数据标准建立203
- 8.1.3平台运行情况监控210
- 8.1.4宏观经济分析场景211
- 8.2电商运营与管理分析平台213
- 8.2.1用户行为分析及商品推荐213
- 8.2.2商品发售及库存安排216
- 8.2.3销售情况实时监控217
- 8.3集团企业经营管理数据分析平台218
- 8.3.1分析平台门户218
- 8.3.2经营管理指标体系构建219
- 8.3.3主题场景模型搭建229
- 8.3.4管理分析平台的应用230
- 8.4本章小结232