怎样能死死地粘住老客户、吸引住新客户、了解客户的喜好兴趣爱好和悲喜,这全是对公司发展尤为重要乃至事关生死攸关的难题,处理这一难题的方式就是说推荐算法。这书分成从上到下三篇,共13章,上篇为客户画像专业知识工程项目基本,包含定性分析模型、肖像测算、储存及各种各样升级维护保养等管理方法实际操作;中篇为推荐算法与客户画像,包含传统式协同过滤等經典推荐系统的详细介绍,及其涉及到客户画像的强烈推荐方式;续篇为运用经典案例,包含Netflix、阿里巴巴等数据信息比赛的經典数据信息实例,及其在实际工程项目开发设计全过程的实际实例,各自从系统软件要求、整体构造、计算机算法、运作步骤及检测結果等五个层面出示详尽实例具体指导。
目录
- 上 篇
- 第1章 用户画像概述 3
- 1.1 用户画像数据来源 3
- 1.1.1 用户属性 5
- 1.1.2 用户观影行为 5
- 1.2 用户画像特性 5
- 1.2.1 动态性 5
- 1.2.2 时空局部性 6
- 1.3 用户画像应用领域 6
- 1.3.1 搜索引擎 6
- 1.3.2 推荐系统 7
- 1.3.3 其他业务定制与优化 7
- 1.4 大数据给用户画像带来的机遇与挑战 8
- 第2章 用户画像建模 9
- 2.1 用户定量画像 9
- 2.2 用户定性画像 10
- 2.2.1 标签与用户定性画像 10
- 2.2.2 基于知识的用户定性画像分析 12
- 2.2.3 用户定性画像的构建 16
- 2.2.4 定性画像知识的存储 22
- 2.2.5 定性画像知识的推理 26
- 2.3 本章参考文献 29
- 第3章 群体用户画像分析 31
- 3.1 用户画像相似度 32
- 3.1.1 定量相似度计算 32
- 3.1.2 定性相似度计算 34
- 3.1.3 综合相似度计算 35
- 3.2 用户画像聚类 36
- 第4章 用户画像管理 41
- 4.1 存储机制 41
- 4.1.1 关系型数据库 42
- 4.1.2 NoSQL数据库 43
- 4.1.3 数据仓库 45
- 4.2 查询机制 46
- 4.3 定时更新机制 47
- 4.3.1 获取实时用户信息 47
- 4.3.2 更新触发条件 48
- 4.3.3 更新机制 49
- 中 篇
- 第5章 视频推荐概述 55
- 5.1 主流推荐方法的分类 56
- 5.1.1 协同过滤的推荐方法 56
- 5.1.2 基于内容的推荐方法 57
- 5.1.3 基于知识的推荐方法 59
- 5.1.4 混合推荐方法 60
- 5.2 推荐系统的评测方法 61
- 5.3 视频推荐与用户画像的逻辑关系 61
- 第6章 协同过滤推荐方法 65
- 6.1 概述 65
- 6.2 关系矩阵及矩阵计算 67
- 6.2.1 U-U矩阵 67
- 6.2.2 V-V矩阵 70
- 6.2.3 U-V矩阵 72
- 6.3 基于记忆的协同过滤算法 74
- 6.3.1 基于用户的协同过滤算法 75
- 6.3.2 基于物品的协同过滤算法 78
- 6.4 基于模型的协同过滤算法 81
- 6.4.1 基于隐因子模型的推荐算法 82
- 6.4.2 基于朴素贝叶斯分类的推荐算法 85
- 6.5 小结 88
- 6.6 本章参考文献 88
- 第7章 基于内容的推荐方法 91
- 7.1 概述 91
- 7.2 CB推荐中的特征向量 94
- 7.2.1 视频推荐中的物品画像 94
- 7.2.2 视频推荐中的用户画像 96
- 7.3 基础CB推荐算法 97
- 7.4 基于TF-IDF的CB推荐算法 99
- 7.5 基于KNN的CB推荐算法 102
- 7.6 基于Rocchio的CB推荐算法 104
- 7.7 基于决策树的CB推荐算法 106
- 7.8 基于线性分类的CB推荐算法 107
- 7.9 基于朴素贝叶斯的CB推荐算法 109
- 7.10 小结 111
- 7.11 本章参考文献 111
- 第8章 基于知识的推荐方法 113
- 8.1 概述 113
- 8.2 约束知识与约束推荐算法 114
- 8.2.1 约束知识示例 114
- 8.2.2 约束满足问题 115
- 8.2.3 约束推荐算法流程 117
- 8.3 关联知识与关联推荐算法 118
- 8.3.1 关联规则描述 118
- 8.3.2 关联规则挖掘 121
- 8.3.3 关联推荐算法流程 123
- 8.4 小结 124
- 8.5 本章参考文献 124
- 第9章 混合推荐方法 125
- 9.1 概述 125
- 9.2 算法设计层面的混合方法 126
- 9.2.1 并行式混合 126
- 9.2.2 整体式混合 129
- 9.2.3 流水线式混合 131
- 9.2.4 典型混合应用系统 133
- 9.3 混合式视频推荐实例 136
- 9.3.1 MoRe系统概览 136
- 9.3.2 MoRe算法介绍 137
- 9.3.3 MoRe算法混合 139
- 9.3.4 MoRe实验分析 140
- 9.4 小结 142
- 9.5 本章参考文献 142
- 第10章 视频推荐评测 145
- 10.1 概述 145
- 10.2 视频推荐试验方法 146
- 10.2.1 在线评测 147
- 10.2.2 离线评测 149
- 10.2.3 用户调查 150
- 10.3 视频离线推荐评测指标 151
- 10.3.1 准确度指标 151
- 10.3.2 多样性指标 159
- 10.4 小结 161
- 10.5 本章参考文献 162
- 下 篇
- 第11章 系统层面的快速推荐构建 165
- 11.1 概述 165
- 11.2 本章主要内容 166
- 11.3 系统部署 166
- 11.3.1 Hadoop2.2.0系统部署 166
- 11.3.2 Hadoop运行时环境设置 169
- 11.3.3 Spark与Mahout部署 175
- 11.4 Mahout推荐引擎介绍 181
- 11.4.1 Item-based算法 181
- 11.4.2 矩阵分解 185
- 11.4.3 ALS算法 187
- 11.4.4 Mahout的Spark实现 190
- 11.5 快速实战 193
- 11.5.1 概述 193
- 11.5.2 日志数据 194
- 11.5.3 运行环境 196
- 11.5.4 基于Mahout Item-based算法实践 201
- 11.5.5 基于Mahout ALS算法实践 205
- 11.6 小结 208
- 11.7 本章参考文献 208
- 第12章 数据层面的分析与推荐案例 211
- 12.1 概述 211
- 12.2 本章主要内容 212
- 12.3 竞赛内容和意义 212
- 12.3.1 竞赛简介 212
- 12.3.2 竞赛任务和意义 213
- 12.4 客户-商户数据 215
- 12.4.1 数据描述 215
- 12.4.2 数据理解与分析 217
- 12.5 算法流程设计 219
- 12.5.1 特征提取 219
- 12.5.2 分类器设计 220
- 12.5.3 算法流程总结 222
- 12.6 小结 222
- 12.7 本章参考文献 223