New Internet:大数据挖掘
作者:谭磊 著
出版时间:2013年版
《New Internet:大数据挖掘》全面地介绍了如何使用数据挖掘技术从各种结构的(数据库)或非结构(Web)的海量数据中提取和产生业务知识。作者梳理了各种数据挖掘常用算法和信息采集技术,系统地描述了实际应用时如何在互联网日志分析、电子邮件营销、互联网广告和电子商务上进行数据挖掘,着重介绍了数据挖掘的原理和算法在互联网海量数据挖掘中的应用。《New Internet:大数据挖掘》主要特点:全面介绍了数据挖掘和大数据的基本概念和技术;大量采用了实际案例,实用性强;详细介绍了大数据挖掘领域最新的商业应用。
目录
- 第1章 绪论——从淘金客到矿山主
- 1.1 大数据时代的“四V”
- 1.2什么是大数据挖掘
- 1.2.1从数据分析到数据挖掘
- 1.2.2Web挖掘
- 1.2.3大数据挖掘之“大”
- 1.3 大数据挖掘的国内外发展
- 1.3.1数据挖掘的应用发展
- 1.3.2数据挖掘研究发展
- 1.4 本书内容
- 第2章 一小时了解数据挖掘
- 2.1数据挖掘是如何解决问题的
- 2.1.1尿不湿和啤酒
- 2.1.2Target和怀孕预测指数
- 2.1.3电子商务网站流量分析
- 2.2分类:从人脸识别系统说起
- 2.2.1分类算法的应用
- 2.2.2数据挖掘分类技术
- 2.2.3分类算法的评估
- 2.3 一切为了商业
- 2.3.1什么是商业智能(Business Intelligence)
- 2.3.2数据挖掘的九大定律
- 2.4 数据挖掘很纠结
- 2.5 数据挖掘的基本流程
- 2.5.1数据挖掘的一般步骤
- 2.5.2 几个数据挖掘中常用的概念
- 2.5.3CRISP-DM
- 2.5.4数据挖掘的评估
- 2.5.5数据挖掘结果的知识表示
- 2.6本章相关资源
- 第3章 数据仓库——数据挖掘的基石
- 3.1存放数据的仓库
- 3.1.1数据仓库的定义
- 3.1.2数据仓库和数据库
- 3.2传统的数据仓库介绍
- 3.3数据仓库基本结构
- 3.4OLAP联机分析处理
- 3.5云存储上的数据仓库
- 3.5.1Google公司的云架构
- 3.5.2开源的分布式系统Hadoop
- 3.5.3Facebook的数据仓库
- 3.5.4NoSQL
- 3.6本章相关资源
- 第4章 数据挖掘算法及原理
- 4.1数据挖掘中的算法
- 4.2数据挖掘十大经典算法
- 4.3分类算法(Classification)
- 4.4聚类算法(Clustering)
- 4.5关联算法
- 4.5.1关联算法中的概念
- 4.5.2关联规则数据挖掘过程
- 4.5.3关联规则的分类
- 4.5.4Apriori算法的执行实例
- 4.5.5关联规则挖掘算法的研究与优化
- 4.6序列挖掘(Sequence Mining)
- 4.7数据挖掘建模语言PMML
- 4.8本章相关资源
- 第5章 在进行数据挖掘之前
- 5.1数据集成
- 5.2为何要做数据预处理
- 5.3数据预处理
- 5.3.1数据清理
- 5.3.2数据转换
- 5.3.3数据规约
- 5.4本章相关资源
- 第6章 R语言和其他数据挖掘工具
- 6.1R语言的历史
- 6.1.1 R语言的特点
- 6.1.2 R语言和数据挖掘
- 6.2其他数据挖掘工具
- 6.2.1 MATLAB
- 6.2.2 其他商用数据挖掘工具
- 6.2.3 开源数据挖掘工具Weka
- 6.3数据挖掘和云
- 6.4本章相关资源
- 第7章 互联网上的日志分析
- 7.1网站日志简介
- 7.2网站日志处理
- 7.2.1 Web日志预处理
- 7.2.2 Web日志分析和数据挖掘
- 7.3邮件日志
- 7.4本章相关资源
- 第8章 数据挖掘和电子邮件
- 8.1邮件营销与垃圾邮件过滤
- 8.2数据挖掘和邮件营销
- 8.2.1 如何有效地进行邮件营销
- 8.2.2 邮件营销案例分享之一
- 8.2.3 邮件营销案例分享之二
- 8.2.4 运用数据挖掘RFM模型提高邮件营销效果
- 8.3 数据挖掘和垃圾邮件过滤
- 8.3.1 垃圾邮件
- 8.3.2 垃圾邮件过滤技术
- 8.3.3 垃圾邮件过滤案例
- 8.4本章相关资源
- 第9章 数据挖掘和互联网广告
- 9.1互联网广告
- 9.2广告作弊行为
- 9.3网站联盟广告
- 9.4 网站联盟广告上的数据挖掘
- 9.4.1 数据助力网盟广告
- 9.4.2 如何应对网盟广告作弊
- 9.5本章相关资源
- 第10章 数据挖掘和电子商务
- 10.1中国电子商务现状
- 10.2在互联网上卖米
- 10.3用数据来掌握客户
- 10.3.1 客户何时来、从哪来
- 10.3.2 客户最喜欢哪种商品
- 10.3.3 竞争与反竞争分析
- 10.3.4 客户还会买什么
- 10.3.5 哪些客户是我们需要的
- 10.4电子商务案例
- 10.4.1 电子商务企业案例一
- 10.4.2 电子商务企业案例二
- 10.5本章相关资源
- 第11章 数据挖掘和Web挖掘
- 11.1互联网上的个性化–Like
- 11.1.1 Like=像
- 11.1.2 Like=喜欢
- 11.2Web挖掘和SNS
- 11.2.1 SNS上的数据价值
- 11.2.2 SNS上的数据关联关系
- 11.2.3 SNS上的用户关系
- 11.3数据挖掘和隐私
- 11.4本章相关资源
- 第12章 数据挖掘和移动互联网
- 12.1移动互联网的特殊性
- 12.1.1 锁定用户的数据价值
- 12.1.2 移动互联网上数据的形式
- 12.1.3 移动互联网地理位置信息的价值
- 12.2 数据挖掘和LBS
- 12.2.1 用PU学习算法做文本挖掘
- 12.2.2 用相似匹配算法做地点挖掘
- 12.3 移动互联网数据面临的问题
- 12.4 本章相关资源
- 附录1 技术词汇表
- 附录2 英语参考文献表
- 附录3 中文参考文献表
- 附录4 微博
- 附录5 博客和其他网址