大数据精准挖掘
作者:吴昱 著
出版时间:2014年版
《大数据精准挖掘》以新兴的大数据时代最实用的技术为支撑,以广阔的科技视野和扎实的专业功底,全面介绍了大数据时代的由来和背景,阐述了与大数据分析相关的理论和数学模型。特别难能可贵的是,本书从蕴含大数据技术的精准数据挖掘工具入手,结合实际的成功案例,将数据精准挖掘的全过程和详细步骤,包括结果验证等方面内容,详详细细并非常专业地展现给读者。本书理论和实践密切结合,文字流畅,深入浅出,通俗易懂。通过本书的学习,可以掌握当下大数据所涉及的主要数学分析模块的要点,并比较相互的特点。同时,能够学会实用的数据挖掘专门技术及经历数据挖掘的全过程。由于本书所介绍的技术与我国目前大数据运用的领军行业金融、保险、电信、电子商务等密切相连,故本书有很强的实用性,能达到学以致用、边学边用的效果。《大数据精准挖掘》适合我国IT业的科研机构、相关企业的专业技术人员的学习之用;本书还可以作为政府部门制定大数据发展战略时的参考。本书也适合全国高等院校的大学生和研究生学习使用;由于本书将理论与具体操作合二为一,故也能作为全国大专院校开设大数据实验课程的教材。
目录
- 第1篇基础篇
- 第1章大数据时代下的数据挖掘3
- 11大数据的基础4
- 111大数据呈现出了数据的新价值4
- 112数据采集、存储与提取技术信息化5
- 113数据挖掘技术是大数据时代最本质特征5
- 12大数据的特点6
- 121数据规模大6
- 122数据类型多6
- 123价值密度低,但总体的数据价值高7
- 124数据处理有速度要求7
- 13大数据的作用7
- 131数据已渗透到社会每个角落8
- 132数据成为竞争的新元素8
- 133数据创造新价值9
- 134大数据地位不断跃升9
- 14大数据与数据挖掘10
- 141数据挖掘技术是大数据时代的灵魂和核心10
- 142数据挖掘技术涉及多种多类的知识节点10
- 143选择最好的数据挖掘工具10
- 15令人期待的大数据时代11
- 16本章小结11
- 第2章大数据与云计算13
- 21大数据与云计算13
- 211大数据与云计算关系13
- 212大数据扩展了云计算服务类型14
- 213云计算数据存储系统得到推广14
- 214追求集成一体化技术14
- 215大数据和云计算缺一不可15
- 22云计算的定义与特点15
- 221云计算的定义15
- 222云计算的特点15
- 23云计算的基本架构16
- 231云计算架构的基本层次16
- 232云计算架构的服务层次16
- 24云计算的关键技术17
- 241虚拟化技术17
- 242数据存储技术19
- 243资源管理技术19
- 244云计算中的编程模型20
- 245集成一体化技术21
- 246自动化技术21
- 25云计算的商业模式21
- 251商业模式是云计算的基石21
- 252云计算的市场规模22
- 253云计算商业模式分析22
- 26本章小结23
- 第2篇理论篇
- 第3章数据挖掘的主要方法及工具27
- 31数据挖掘主要方法27
- 311决策树分类27
- 312神经网络33
- 313Logistic回归方法37
- 314聚类分析38
- 315数据挖掘方法比较39
- 316分类器的评估与选择40
- 32流行数据分析平台及数据挖掘工具介绍46
- 33本章小结52
- 第4章Logistic回归模型53
- 41多元线性回归模型53
- 42Logistic回归模型55
- 43Logistic回归模型的参数估计56
- 44Logistic回归模型中回归系数的意义58
- 45Logistic回归模型的拟合优度63
- 46Logistic回归系数的显著性检验72
- 47Logistic回归模型的预测准确性75
- 48回归变量的选择与逐步回归77
- 49本章小结83
- 第5章数据挖掘建模过程86
- 51CRISPDM86
- 52SAS数据挖掘方法论——SEMMA88
- 53数据挖掘经验谈89
- 54本章小结89
- 第3篇应用篇
- 第6章金融行业应用1——信用评分93
- 61国内信用卡业务现状93
- 62信用评分模型的起源、类别和发展94
- 63信用评分的步骤95
- 64实例演示97
- 641二元变量预测建模98
- 642图形版建模输出讲解1——效果评价101
- 643图形版建模输出讲解2——评分卡文件103
- 65本章小结109
- 第7章金融行业应用2——信用卡催收评分110
- 71信用卡催收评分模型背景介绍110
- 72实例演示112
- 721图形版连续变量预测建模112
- 722图形版建模输出114
- 73本章小结116
- 第8章保险电销应用——寻找目标客户117
- 81背景介绍117
- 82案例数据展示及分析118
- 821业务目标118
- 822数据展示118
- 83数据挖掘与分析过程120
- 831数据预处理120
- 832造变量122
- 833生成挖掘表123
- 834建立响应模型125
- 835建模结果分析125
- 84数据挖掘结果的运用129
- 85本章小结129
- 第9章电信行业应用——客户流失预测131
- 91背景介绍131
- 92案例数据展示及分析131
- 921商业理解131
- 922数据理解132
- 923数据准备132
- 93建立打分模型133
- 94分析建模结果134
- 95数据挖掘结果的运用136
- 96本章小结137
- 第10章商品零售行业应用——购物篮分析138
- 101某连锁零售公司的背景介绍138
- 102购物篮分析的基本内容139
- 1021同次购买的基本概念139
- 1022同次购买的关联规则质量的衡量140
- 1023购买分析的实现141
- 1024下次购买的基本概念142
- 1025下次购买行为预测142
- 103购物篮分析——MBA工具的使用145
- 1031MBA工具的用途145
- 1032MBA工具的使用146
- 1033MBA工具的输出146
- 104本章小结149
- 第11章实战项目——交叉销售150
- 111背景介绍150
- 112案例数据展示及分析151
- 1121数据展示151
- 1122业务目标及分析要求152
- 113数据挖掘过程152
- 1131数据预处理152
- 1132划分数据集及生成目标变量153
- 1133生成衍生变量154
- 1134生成挖掘表159
- 114建立打分模型160
- 115结果分析161
- 116本章小结162
- 第12章收益预测163
- 121背景介绍163
- 122数据展示163
- 1221原始数据集展示163
- 1222数据挖掘表的生成165
- 123图形版建模166
- 1231建模过程166
- 1232模型输出166
- 1233为新数据集打分168
- 124本章小结170
- 参考文献172