《机器学习在线:解析阿里云机器学习平台》以深度学习中的经典案例主导线,条分缕析整理阿里云的服务平台作用,解读怎样用阿里云的机器学习平台来保持各种运用,包含店家做弊检验、存活分折、信贷风险分折、客户选购个人行为分折等,并详细地详细介绍了深度学习的基本概念与实践活动方法。
以深度学习中的经典案例主导线,条分缕析整理阿里云的服务平台作用,解读怎样用阿里云的机器学习平台来保持各种运用,包含店家做弊检验、存活分折、信贷风险分折、客户选购个人行为分折等,并详细地详细介绍了深度学习的基本概念与实践活动方法。
目录
- 第1章 阿里云机器学习 1
- 1.1 产品特点 1
- 1.2 名词解释 2
- 1.3 构建机器学习实验 3
- 1.3.1 新建实验 3
- 1.3.2 使用组件搭建工作流 4
- 1.3.3 运行实验、查看结果 5
- 1.3.4 模型部署、在线预测 6
- 第2章 商家作弊行为检测 7
- 2.1 数据探索 8
- 2.2 建模、预测和评估 15
- 2.3 尝试其他分类模型 19
- 2.4 判断商家作弊 24
- 第3章 生存预测 27
- 3.1 数据集一 27
- 3.1.1 特征分析 28
- 3.1.2 生存预测 33
- 3.2 数据集二 36
- 3.2.1 随机森林模型 39
- 3.2.2 朴素贝叶斯模型 47
- 第4章 信用风险预测 50
- 4.1 整体流程 53
- 4.1.1 特征哑元化 54
- 4.1.2 特征重要性 57
- 4.2 模型效果评估 61
- 4.3 减少模型特征的个数 62
- 第5章 用户购买行为预测 65
- 5.1 数据探索 66
- 5.2 思路 68
- 5.2.1 用户和品牌的各种特征 69
- 5.2.2 二分类模型训练 71
- 5.3 计算训练数据集 71
- 5.3.1 原始数据划分 72
- 5.3.2 计算特征 74
- 5.3.3 计算标签 89
- 5.4 二分类模型训练 90
- 5.4.1 正负样本配比 90
- 5.4.2 逻辑回归算法 92
- 5.4.3 随机森林算法 94
- 第6章 聚类与分类 96
- 6.1 数据可视化 97
- 6.2 K-Means聚类 98
- 6.2.1 聚类、评估流程 100
- 6.2.2 聚成两类 101
- 6.2.3 聚成三类 103
- 6.3 K最近邻算法 104
- 6.3.1 使用KNN算法进行分类 105
- 6.3.2 算法比较 108
- 6.4 多分类模型 109
- 6.4.1 使用朴素贝叶斯算法 109
- 6.4.2 使用逻辑回归多分类算法 112
- 6.4.3 使用随机森林算法 115
- 6.4.4 各多分类模型效果对比 118
- 第7章 葡萄酒品质预测 119
- 7.1 数据探索 120
- 7.2 线性回归 123
- 7.3 GBDT回归 125
- 第8章 文本分析 127
- 8.1 分词 128
- 8.2 词频统计 130
- 8.3 单词的区分度 131
- 8.4 字符串比较 133
- 8.5 抽取关键词、关键句 139
- 8.5.1 原理简介 139
- 8.5.2 完整流程 141
- 8.6 主题模型 146
- 8.6.1 LDA模型 147
- 8.6.2 新闻的主题模型 149
- 8.6.3 数据预处理 150
- 8.6.4 主题与原始分类的关系 153
- 8.7 单词映射为向量 160
- 8.7.1 相近单词 162
- 8.7.2 单词聚类 165
- 8.8 组件使用小结 168
- 第9章 基于用户退货描述的赔付预测 170
- 9.1 思路 171
- 9.2 训练集的特征生成 173
- 9.3 测试集的特征生成 180
- 9.4 模型训练、预测、评估 181
- 9.5 提高召回率 185
- 第10章 情感分析 189
- 10.1 词袋模型 190
- 10.1.1 训练集的特征生成 192
- 10.1.2 测试集的特征生成 196
- 10.1.3 模型训练、预测、评估 197
- 10.2 词向量模型 200
- 10.2.1 特征生成 201
- 10.2.2 模型训练 206
- 第11章 影片推荐 211
- 11.1 协同过滤 212
- 11.2 整体流程 213
- 11.3 预处理,过滤出好评信息 215
- 11.4 计算影片间的相似度 215
- 11.5 计算用户可能喜欢的影片 221
- 11.6 查看推荐效果 224
- 第12章 支持深度学习框架 227
- 12.1 TensorFlow组件简介 227
- 12.2 Softmax模型 231
- 12.3 深度神经网络 234
- 附录A 237