数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。大多数数据挖掘的教材都专注于介绍理论基础,因而往往难以理解和学习。
写给程序员的数据挖掘实践指南是介绍写给程序员的一本数据挖掘指南,可以帮助读者动手实践进行数据挖掘、集体智慧并构建推荐系统。全书共8章,介绍了数据挖掘的基本知识和理论、协同过滤、内容过滤及分类、算法评估、朴素贝叶斯、非结构化文本分类以及聚类等内容。全书采用做中学的方式,用生动的图示、大量的表格、简明的公式,实用的Python代码示例,阐释数据挖掘的知识和技能。每章还给出了习题和练习,帮助读者巩固所学的知识。
本书专注适合对数据挖掘、数据分析和推荐系统感兴趣的程序员及相关领域的从业者阅读参考;同时,本书也可以作为一本轻松有趣的数据挖掘课程教学参考书。
目录
- 第1章 数据挖掘简介及本书使用方法 1
- 第2章 协同过滤—爱你所爱 14
- 第3章 协同过滤—隐式评级及基于物品的过滤 56
- 第4章 内容过滤及分类—基于物品属性的过滤 93
- 第5章 分类的进一步探讨—算法评估及kNN 139
- 第6章 概率及朴素贝叶斯—朴素贝叶斯 170
- 第7章 朴素贝叶斯及文本—非结构化文本分类 226
- 第8章 聚类—群组发现 256