《集体智慧编程》內容详实,包含合作过虑技术性(保持关系推荐产品作用)、集群服务器数据统计分析(在规模性统计数据集中化挖掘类似的统计数据子集)、百度搜索引擎关键技术(网络爬虫、引索、查寻模块、PageRank优化算法等)、检索海量信息并开展剖析统计分析下结论的优化计算方法、贝叶斯过虑技术性(垃圾邮件过滤、文字过虑)、用决策树技术性保持分折和管理决策模型作用、社交媒体的信息内容配对技术性、深度学习和人工智能技术等。《集体智慧编程》是Web开发人员、系统架构师、运用技术工程师等的极佳挑选。
这书以深度学习与测算统计分析为主题风格背景图,专业叙述怎样发掘和剖析Web上的统计数据和資源,怎样剖析客户体验、网络营销、本人品位等众多信息内容,并算出有效的依据,根据繁杂的优化算法来从Web网址获得、搜集并剖析客户的统计数据和意见反馈信息内容,便于造就新的客户使用价值和经济收益。全书內容详实,包含合作过虑技术性(保持关系推荐产品作用)、集群服务器数据统计分析(在规模性统计数据集中化挖掘类似的统计数据子集)、百度搜索引擎关键技术(网络爬虫、引索、查寻模块、PageRank优化算法等)、检索海量信息并开展剖析统计分析下结论的优化计算方法、贝叶斯过虑技术性(垃圾邮件过滤、文字过虑)、用决策树技术性保持分折和管理决策模型作用、社交媒体的信息内容配对技术性、深度学习和人工智能技术等。
这书是Web开发人员、系统架构师、运用技术工程师等的极佳挑选。
目录
- 前言 viii
- 第1章 集体智慧导言 1
- 什么是集体智慧 2
- 什么是机器学习 3
- 机器学习的局限 4
- 真实生活中的例子 5
- 学习型算法的其他用途 5
- 第2章 提供推荐 7
- 协作型过滤 7
- 搜集偏好 8
- 寻找相近的用户 9
- 推荐物品 15
- 匹配商品 17
- 构建一个基于del.icio.us的链接推荐系统 19
- 基于物品的过滤 22
- 使用MovieLens数据集 25
- 基于用户进行过滤还是基于物品进行过滤 27
- 练习 28
- 第3章 发现群组 29
- 监督学习和无监督学习 29
- 单词向量 30
- 分级聚类 33
- 绘制树状图 38
- 列聚类 40
- K-均值聚类 42
- 针对偏好的聚类 44
- 以二维形式展现数据 49
- 有关聚类的其他事宜 53
- 练习 53
- 第4章 搜索与排名 54
- 搜索引擎的组成 54
- 一个简单的爬虫程序 56
- 建立索引 58
- 查询 63
- 基于内容的排名 64
- 利用外部回指链接 69
- 从点击行为中学习 74
- 练习 84
- 第5章 优化 86
- 组团旅游 87
- 描述题解 88
- 成本函数 89
- 随机搜索 91
- 爬山法 92
- 模拟退火算法 95
- 遗传算法 97
- 真实的航班搜索 101
- 涉及偏好的优化 106
- 网络可视化 110
- 其他可能的应用场合 115
- 练习 116
- 第6章 文档过滤 117
- 过滤垃圾信息 117
- 文档和单词 118
- 对分类器进行训练 119
- 计算概率 121
- 朴素分类器 123
- 费舍尔方法 127
- 将经过训练的分类器持久化 132
- 过滤博客订阅源 134
- 对特征检测的改进 136
- 使用Akismet 138
- 替代方法 139
- 练习 140
- 第7章 决策树建模 142
- 预测注册用户 142
- 引入决策树 144
- 对树进行训练 145
- 选择最合适的拆分方案 147
- 以递归方式构造树 149
- 决策树的显示 151
- 对新的观测数据进行分类 153
- 决策树的剪枝 154
- 处理缺失数据 156
- 处理数值型结果 158
- 对住房价格进行建模 158
- 对“热度”评价进行建模 161
- 什么时候使用决策树 164
- 练习 165
- 第8章 构建价格模型 167
- 构造一个样本数据集 167
- k-最近邻算法 169
- 为近邻分配权重 172
- 交叉验证 176
- 不同类型的变量 178
- 对缩放结果进行优化 181
- 不对称分布 183
- 使用真实数据——eBay API 189
- 何时使用k-最近邻算法 195
- 练习 196
- 第9章 高阶分类:核方法与SVM 197
- 婚介数据集 197
- 数据中的难点 199
- 基本的线性分类 202
- 分类特征 205
- 对数据进行缩放处理 209
- 理解核方法 211
- 支持向量机 215
- 使用LIBSVM 217
- 基于Facebook的匹配 219
- 练习 225
- 第10章 寻找独立特征 226
- 搜集一组新闻 227
- 先前的方法 231
- 非负矩阵因式分解 232
- 结果呈现 240
- 利用股票市场的数据 243
- 练习 248
- 第11章 智能进化 250
- 什么是遗传编程 250
- 将程序以树形方式表示 253
- 构造初始种群 257
- 测试题解 259
- 对程序进行变异 260
- 交叉 263
- 构筑环境 265
- 一个简单的游戏 268
- 更多可能性 273
- 练习 276
- 第12章 算法总结 277
- 贝叶斯分类器 277
- 决策树分类器 281
- 神经网络 285
- 支持向量机 289
- k-最近邻 293
- 聚类 296
- 多维缩放 300
- 非负矩阵因式分解 302
- 优化 304
- 附录A:第三方函数库 309
- 附录B:数学公式 316
- 索引 323