本书是一本从机器学习视角讲解计算机视觉的非常好的教材,全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握,作者通过系统地介绍计算机视觉的模型、学习和推理方法,阐述了计算机视觉的基本原理和技术,书中举例详实,注重实际应用,既有理论知识又有实际案例,使读者能够更好地理解和应用所学知识,整体而言,这本书内容丰富,设计合理,是一本值得推荐给计算机视觉学习者的教材。
读者评价
前十三章讲的机器学习可是看作prml内容的简略翻译中文版 后面的就是opencv的文档
内容不错,很有条理性,算法深入浅出。不过有较多的印刷错误。
原先只有英文版的电子书,刚好书香节活动,趁着把相关的书全买了,这本也是同事推荐,应该没错,之前推荐的模式识别也是很不错的一本
还没细看,粗略翻阅了一下,前面很大概讲概率论的内容,后面讲一些算法,有一些专业术语不是学过的还要自己去找资料查阅,总体来说,不是一本入门级别的书
内容介绍
本书是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的联系,以及如何如何研究这些联系来从新的图像数据中作出新的推理。本书要求少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也非常有用。
目录
- 译者序
- 译者简介
- 序
- 前言
- 第1章绪论1
- 第一部分概率
- 第2章概率概述6
- 讨论10
- 备注11
- 习题11
- 第3章常用概率分布12
- 总结18
- 备注18
- 习题18
- 第4章拟合概率模型21
- 总结31
- 备注31
- 习题32
- 第5章正态分布34
- 总结38
- 备注39
- 习题39
- 第二部分机器视觉的机器学习
- 第6章视觉学习和推理42
- 总结51
- 备注51
- 习题52
- 第7章复杂数据密度建模54
- 总结80
- 备注80
- 习题81
- 第8章回归模型82
- 讨论98
- 备注98
- 习题98
- 第9章分类模型100
- 讨论125
- 备注125
- 习题127
- 第三部分连接局部模型
- 第10章图模型130
- 讨论145
- 备注145
- 习题145
- 第11章链式模型和树模型147
- 讨论167
- 备注168
- 习题169
- 第12章网格模型172
- 讨论198
- 备注198
- 习题200
- 第四部分预处理
- 第13章图像预处理与特征提取204
- 结论223
- 备注223
- 习题224
- 第五部分几何模型
- 第14章针孔摄像机228
- 讨论245
- 备注245
- 习题246
- 第15章变换模型249
- 讨论270
- 备注270
- 习题271
- 第16章多摄像机系统273
- 讨论293
- 备注293
- 习题294
- 第六部分视觉模型
- 第17章形状模型298
- 讨论322
- 备注322
- 习题324
- 第18章身份与方式模型326
- 讨论346
- 备注346
- 习题348
- 第19章时序模型349
1)定义了从图像像素映射到不同类别的分类评分函数。评分函数是一个基于权重W和偏差b的线性函数; 2)与KNN分类器不同,参数方法的优势在于一旦通过训练学习到了参数,就可以将训练数据丢弃。同时该方法对于新的测试数据的预测非常快,因为只需要与权重w进行一个矩阵乘法运算。 3)介绍偏差技巧,让我们能够将偏差向量和权重矩阵合二为一,然后就可以只跟踪一个矩阵; 4)定义了损失函数(SVM和Softmax线性分类器)。损失函数能够衡量给出的参数集和训练数据集真实类别情况之间的一致性。在损失函数的定义中可以看到,对训练数据做出良好预测与得到一个足够低的损失函数是等价的。
最近要找工作,个人比较心仪的岗位当然是DL&CV,大概是因为硕士期间对这些研究的比较多。有时接触的东西多了,但是很多看了一次就忘记了,就算是看过多次的也留不下多少记忆。原因当然是没有系统地进行总结过,没有把知识点串联起来。 第一次接触到机器学习(同时也是第一次听说机器学习),还是在大四那年寒假左右,大概是2016年初。当时好像是在别人的百度云盘分享里面看到了一本叫做《机器学习实战》的书。那时候只是觉得那玩意很厉害,为什么自己现在才发现?而且里面推荐使用的语言是Python,正好那时也接触了Python这门语言,也算是入门了。可是当时并没有过多地去研究机器学习。不过当时的本科毕业设计做的是与图像相关的,图像视觉安全质量评估。那时候也是刚刚接触图像。之前没有接触过。那个时候我是用的OpenCV和C++做的毕业设计。而其中用到的核心函数大概就是OpenCV自带的Canny函数了。当时其实可以选择用Matlab实现的,但考虑到总总原因,还是选择了C++,因为自己当时对Matlab不感冒(现在也是,摊手笑哭)。毕竟C佳佳要显得高大上些。这个毕业设计是跟着一个博士师兄做的。实现他发表的一篇论文里面的算法。大概就是提取图像的边缘特征以及纹理特征,然后算出图像的视觉安全得分。好了,闲话大概就到这个地方吧。 后面再次接触机器学习还是研一上学期,那时候实验室开了一门讨论班,讲的就是机器学习,那时用的教材是CMU的Mitchell写的黑皮《机器学习》。自己也参与讲了几节。研一寒假(2017年初),在别人的推荐下,入手了李航博士的那本《统计学习基础》,当时还把书带回了家,希望寒假能够读完,遗憾的是第一页都没有翻开过(今年寒假也带回家了,一样的没有读完)。后来研一下学期,学习了那门课,用的是西瓜书。研二上学期学习了花书《深度学习》(17年暑假刚刚出版),也讲了机器学习那个部分,以及深度学习的卷积神经网络(CNN)。同时研二上学期也开始写小论文,涉及到的就是深度学习和计算机视觉。具体是使用卷积神经网络对图像进行质量评估(没错,整个研究生期间,入的就是这个坑)。所以对于机器学习和深度学习、计算机视觉还是有很多要总结的。