通俗地讲,计算机视觉就是给计算机安装上眼睛(照相机)和大脑(算法),让其能够感知周围的环境。它是对生物视觉的一种模拟,通常的做法是通过对采集的图像或者视频进行处理来获得相应场景的三维信息。计算机视觉不仅应用在计算机科学和工程、信号处理、物理学、应用数学和统计学中,也广泛应用在神经生理学和认知科学等领域,发展前景可见一斑。
工欲善其事,必先利其器。作为如今开发计算机视觉应用最流行的库之一,OpenCV不但能够实时运行许多不同的计算机视觉算法,而且几乎可以兼容所有的平台。
本书本着学以致用的精神,每章都包含现实世界的例子和示例代码,以帮助读者更好地了解它们在现实生活中的应用。桃李不言,下自成蹊,对本书最真实的评价,来自于广大的读者朋友。
本书翻译的过程并不短暂,作为译者,我们尽可能地忠于原著。对于本书中大量的专业术语尽量遵循已有的标准,并参阅了大量文献,以便于读者理解。
全书由呆萌院长、李风明和李翰阳共同完成翻译。由于水平有限,书中出现的错误和不妥之处,恳请读者批评指正。
封面图
目录
- 译者序
- 前言
- 第1章OpenCV的探险之旅1
- 1.1理解人类视觉系统1
- 1.2人类是怎么理解图像内容的3
- 1.3OpenCV可以做什么4
- 1.4安装OpenCV11
- 1.5总结14
- 第2章OpenCV基础知识介绍15
- 2.1CMake基本配置文件15
- 2.2创建库16
- 2.3管理依赖关系17
- 2.4脚本复杂化19
- 2.5图像和矩阵21
- 2.6读写图像23
- 2.7读取视频和摄像头27
- 2.8其他基本对象类型30
- 2.9矩阵的基本运算33
- 2.10基本数据持久性和存储36
- 2.11总结38
- 第3章图形用户界面和基本滤波39
- 3.1介绍OpenCV的用户界面39
- 3.2使用OpenCV实现基本图形用户界面40
- 3.3QT的图形用户界面45
- 3.4在界面上添加滑动条和鼠标事件47
- 3.5在用户界面上添加按钮51
- 3.6支持OpenGL55
- 3.7总结60
- 第4章深入研究直方图和滤波器61
- 4.1生成CMake脚本文件62
- 4.2创建图形用户界面63
- 4.3绘制直方图65
- 4.4图像色彩均衡化69
- 4.5LOMO效果71
- 4.6卡通效果76
- 4.7总结80
- 第5章自动光学检测、目标分割和检测81
- 5.1隔离场景中的目标82
- 5.2创建AOI应用程序84
- 5.3输入图像的预处理86
- 5.4分割输入图像92
- 5.5总结101
- 第6章学习目标分类102
- 6.1介绍机器学习的概念103
- 6.2计算机视觉和机器学习的工作流程106
- 6.3自动检测目标分类的示例108
- 6.4特征提取110
- 6.5总结120
- 第7章识别人脸部分并覆盖面具121
- 7.1理解Haar级联121
- 7.2积分图123
- 7.3在实时视频中覆盖上面具124
- 7.4戴上太阳镜127
- 7.5跟踪鼻子、嘴和耳朵130
- 7.6总结131
- 第8章视频监控、背景建模和形态学操作132
- 8.1理解背景差分132
- 8.2简单背景差分法133
- 8.3帧差值法137
- 8.4混合高斯方法141
- 8.5形态学图像操作144
- 8.6图像细化145
- 8.7图像加粗146
- 8.8其他形态学运算147
- 8.9总结152
- 第9章学习对象跟踪153
- 9.1跟踪特定颜色的对象153
- 9.2建立交互式对象跟踪器156
- 9.3使用Harris角点检测器检测点161
- 9.4Shi-Tomasi角点检测器163
- 9.5基于特征的跟踪166
- 9.6总结175
- 第10章文本识别中的分割算法176
- 10.1OCR简介176
- 10.2预处理步骤178
- 10.3在你的操作系统上安装Tesseract OCR186
- 10.4使用Tesseract OCR库190
- 10.5总结195
- 第11章使用Tesseract识别文本196
- 11.1文本识别API工作原理196
- 11.2使用文本识别API200
- 11.3总结212