内容简介
本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种无监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的MATLAB程序源代码,可以用来进行简单的测试。
本书适合所有对机器学习有兴趣的初学者阅读。
187张图解轻松入门
提供可执行的Matlab程序代码
覆盖机器学习中最经典、用途最广的算法
专业实用
东京大学教授、机器学习权威专家执笔,浓缩机器学习的关键知识点
图文并茂
187张图示帮助理解,详略得当,为读懂大部头开路。
角度新颖
基于最小二乘法讲解各种有监督学习的回归和分类算法,以及无监督学习算法。
实战导向
配有可执行的MATLAB程序代码,边学习边实践。
目录
- 第I部分绪论
- 第1章什么是机器学习2
- 1.1学习的种类2
- 1.2机器学习任务的例子4
- 1.3机器学习的方法8
- 第2章学习模型12
- 2.1线性模型12
- 2.2核模型15
- 2.3层级模型17
- 第II部分有监督回归
- 第3章最小二乘学习法22
- 3.1最小二乘学习法22
- 3.2最小二乘解的性质25
- 3.3大规模数据的学习算法27
- 第4章带有约束条件的最小二乘法31
- 4.1部分空间约束的最小二乘学习法31
- 4.2l2约束的最小二乘学习法33
- 4.3模型选择37
- 第5章稀疏学习43
- 5.1l1约束的最小二乘学习法43
- 5.2l1约束的最小二乘学习的求解方法45
- 5.3通过稀疏学习进行特征选择50
- 5.4lp约束的最小二乘学习法51
- 5.5l1+l2约束的最小二乘学习法52
- 第6章鲁棒学习55
- 6.1l1损失最小化学习56
- 6.2Huber损失最小化学习58
- 6.3图基损失最小化学习63
- 6.4l1约束的Huber损失最小化学习65
- 第III部分有监督分类
- 第7章基于最小二乘法的分类70
- 7.1最小二乘分类70
- 7.20/1损失和间隔73
- 7.3多类别的情形76
- 第8章支持向量机分类80
- 8.1间隔最大化分类80
- 8.2支持向量机分类器的求解方法83
- 8.3稀疏性86
- 8.4使用核映射的非线性模型88
- 8.5使用Hinge损失最小化学习来解释90
- 8.6使用Ramp损失的鲁棒学习93
- 第9章集成分类98
- 9.1剪枝分类98
- 9.2Bagging学习法101
- 9.3Boosting学习法105
- 第10章概率分类法112
- 10.1Logistic回归112
- 10.2最小二乘概率分类116
- 第11章序列数据的分类121
- 11.1序列数据的模型化122
- 11.2条件随机场模型的学习125
- 11.3利用条件随机场模型对标签序列进行预测128
- 第IV部分无监督学习
- 第12章异常检测132
- 12.1局部异常因子132
- 12.2支持向量机异常检测135
- 12.3基于密度比的异常检测137
- 第13章无监督降维143
- 13.1线性降维的原理144
- 13.2主成分分析146
- 13.3局部保持投影148
- 13.4核函数主成分分析152
- 13.5拉普拉斯特征映射155
- 第14章聚类158
- 14.1K均值聚类158
- 14.2核K均值聚类160
- 14.3谱聚类161
- 14.4调整参数的自动选取163
- 第V部分新兴机器学习算法
- 第15章在线学习170
- 15.1被动攻击学习170
- 15.2适应正则化学习176
- 第16章半监督学习181
- 16.1灵活应用输入数据的流形构造182
- 16.2拉普拉斯正则化最小二乘学习的求解方法183
- 16.3拉普拉斯正则化的解释186
- 第17章监督降维188
- 17.1与分类问题相对应的判别分析188
- 17.2充分降维195
- 第18章迁移学习197
- 18.1协变量移位下的迁移学习197
- 18.2类别平衡变化下的迁移学习204
- 第19章多任务学习212
- 19.1使用最小二乘回归的多任务学习212
- 19.2使用最小二乘概率分类器的多任务学习215
- 19.3多次维输出函数的学习216
- 第VI部分结语
- 第20章总结与展望222
- 参考文献225
本来想打4星,但是系列另一本实在太差,衬托之下这本不要太好。起初看到一堆acg图还在想这不是来搞笑的吗,但是仔细一读,发现作者从统计学观点出发将机器学习中基本模型之间的联系展示得相当清晰,就像是盖楼地基砖块之间的粘合剂,而且数学部分赏心悦目,严谨一致。内容安排也很连贯,前后呼应,基本上对每一个重要的模型都会分别用线性模型和核模型来阐释,既讲了基本原理,又做了一定的拓展。不太推荐入门,建议有点了解后再来看,会受益匪浅。希望写书的老师们都学学,如何有逻辑地安排内容,而不是把所有的东西都一股脑列出来。
很多数学公式,比起教科书强了那么一点。
如果没有概率基础,没有行列式基础,那么看书一样很吃力。
当然,只要坚持刨根问底,不去推导公式,仅仅理解一下还是有用的。
记得微软的一个机器学习类库,有个讲侦探的故事来说明贝叶斯推理机的原理。很不错