本书将传统的图像处理技术、机器学习时代的图像技术,到目前炙手可热的深度学习时代的图像处理技术融汇贯通起来。生动的结合了目前热门的应用,以抖音、美颜相机、手机自带的滤镜和美颜功能为切入点,专注于人脸图像的各种处理,大量实际案例,带领读者与一线AI图像算法工程师在项目实践中的如何设计算法流程,如何优化算法逻辑,如何将算法应用到实际的场景中。另外本身的最后一章,深扒了目前抖音、美颜相机、天天P图、淘宝、京东等APP里面图像技术的应用场景以及实现原理,提纲挈领的概述了电商、娱乐、金融、安防这四大领域中应用的AI+图像技术实现思路。让读者可以对整个中国AI+图像的应用现状以及前景有直观的认知。
封面图
目录
- 推荐序
- 前言
- 第1章 AI时代:图像技术背景知识1
- 1.1 人工智能的前世今生2
- 1.2 AI与CV的相互融合之路3
- 1.3 AI图像处理技术5
- 1.4 本章小结7
- 第2章 武器和铠甲:开发环境配置8
- 2.1 来自传承的馈赠:OpenCV开源跨平台机器视觉库8
- 2.1.1 OpenCV的整体概念9
- 2.1.2 OpenCV的应用领域9
- 2.1.3 OpenCV的编程语言9
- 2.1.4 OpenCV支持的系统10
- 2.1.5 OpenCV的线上资源10
- 2.2 召唤萌宠:Python语言的“制霸”之路10
- 2.2.1 Python语言的发展11
- 2.2.2 Python 2.7.X版本和3.X版本的区别 11
- 2.2.3 本书采用的Python版本 13
- 2.3 铸剑:基于PyCharm的系统环境配置14
- 2.3.1 PyCharm在Mac OS系统下的安装和配置14
- 2.3.2 Mac OS系统下Anaconda的安装和配置17
- 2.4 牛刀小试:一起动手来写个例子吧19
- 2.5 本章小结21
- 第3章 开启星辰大海:图像处理技术基础知识22
- 3.1 图像的基本概念23
- 3.1.1 像素的概念23
- 3.1.2 图像的构成24
- 3.1.3 图像的格式24
- 3.1.4 理解图像的位深和通道的概念25
- 3.2 图像的读取、显示和存储操作26
- 3.2.1 OpenCV基本图像处理函数26
- 3.2.2 Python读取一张图片并显示和存储27
- 3.3 从像素出发构建二维灰度图像28
- 3.3.1 NumPy科学计算库28
- 3.3.2 创建二维灰度图像30
- 3.3.3 灰度图像的遍历31
- 3.4 灰度图像和彩色图像的变换32
- 3.4.1 图像的颜色空间32
- 3.4.2 彩色图像的通道分离和混合33
- 3.4.3 彩色图像的通道分离和混合程序示例34
- 3.4.4 彩色图像的二值化35
- 3.4.5 彩色图像的遍历37
- 3.4.6 彩色图像和灰度图像的转换38
- 3.5 图像的几何变换40
- 3.5.1 图像几何变换的基本概念40
- 3.5.2 插值算法41
- 3.5.3 图像的缩放42
- 3.5.4 图像的平移44
- 3.5.5 图像的旋转45
- 3.5.6 图像的镜像变换47
- 3.6 图像色彩空间基础知识48
- 3.6.1 图像的色调、色相、饱和度、亮度和对比度48
- 3.6.2 RGB色彩空间49
- 3.6.3 HSV色彩空间49
- 3.6.4 HSI色彩空间50
- 3.7 图像的直方图50
- 3.7.1 图像直方图的基本概念50
- 3.7.2 绘制灰度图像的直方图51
- 3.7.3 绘制彩色图像的直方图53
- 3.7.4 图像直方图均衡化54
- 3.7.5 图像直方图反向投影56
- 3.8 本章小结58
- 第4章 First Blood:第一波项目实战59
- 4.1 抖音哈哈镜60
- 4.1.1 抖音的哈哈镜效果60
- 4.1.2 哈哈镜的原理61
- 4.1.3 哈哈镜的程序实现61
- 4.2 给你一张老照片64
- 4.2.1 怀旧风格算法原理64
- 4.2.2 怀旧风格程序实现65
- 4.3 给自己画一张文艺范的素描66
- 4.3.1 轮廓检测算法原理66
- 4.3.2 素描风格算法原理67
- 4.3.3 素描风格算法的程序实现68
- 4.4 来一张油画吧69
- 4.4.1 图像油画算法原理69
- 4.4.2 图像油画算法的程序实现69
- 4.5 如何打马赛克72
- 4.5.1 马赛克算法原理72
- 4.5.2 马赛克算法的程序实现72
- 4.6 打造自己的专属肖像漫画74
- 4.6.1 漫画风格算法原理74
- 4.6.2 漫画风格算法的程序实现74
- 4.7 本章小结76
- 第5章 Double Kill:视频图像处理理论和项目实战77
- 5.1 视频处理流程和原理78
- 5.1.1 视频的捕获和存储78
- 5.1.2 提取视频中的某些帧79
- 5.1.3 将图片合成为视频80
- 5.1.4 多个视频合并81
- 5.2 抖音中的视频抖动效果设计82
- 5.2.1 视频抖动的原理82
- 5.2.2 视频抖动的程序实现83
- 5.3 抖音中的视频闪白效果设计85
- 5.3.1 视频闪白的原理86
- 5.3.2 视频闪白的程序实现87
- 5.4 抖音中的视频霓虹效果设计90
- 5.4.1 视频霓虹的原理90
- 5.4.2 视频霓虹效果的程序实现91
- 5.5 抖音中的视频时光倒流效果设计94
- 5.5.1 视频时光倒流的原理94
- 5.5.2 视频时光倒流的程序实现94
- 5.6 抖音中的视频反复效果设计95
- 5.6.1 视频反复的原理95
- 5.6.2 视频反复的程序实现95
- 5.7 抖音中的视频慢动作效果设计96
- 5.7.1 视频慢动作的原理97
- 5.7.2 视频慢动作的程序实现97
- 5.8 视频人物漫画风格滤镜设计98
- 5.9 本章小结99
- 第6章 Triple Kill:基于机器学习的人脸识别100
- 6.1 机器学习的基本概念101
- 6.1.1 机器学习的目的101
- 6.1.2 机器学习的内容102
- 6.1.3 机器学习的作用103
- 6.1.4 如何使用机器学习获得的东西105
- 6.1.5 使用机器学习方法的时机106
- 6.1.6 总结机器学习的基本概念108
- 6.2 机器学习中的图像预处理流程112
- 6.2.1 一个经典的机器学习图像处理实例112
- 6.2.2 人脸识别机器学习Model训练思路113
- 6.2.3 正样本图像预处理113
- 6.2.4 负样本图像预处理121
- 6.3 人脸检测机器学习算法设计123
- 6.3.1 图像特征123
- 6.3.2 Harr-like特征求值加速算法127
- 6.3.3 图像分类器128
- 6.3.4 人脸检测的训练算法流程130
- 6.3.5 人脸检测的检测算法流程131
- 6.4 训练人脸检测分类器并测试132
- 6.4.1 训练准备132
- 6.4.2 开始训练133
- 6.4.3 模型测试134
- 6.5 本章小结135
- 第7章 Quatary Kill:基于深度学习的人脸识别137
- 7.1 深度学习的基本概念138
- 7.1.1 深度学习简介138
- 7.1.2 深度学习和机器学习的区别139
- 7.1.3 深度学习入门概念141
- 7.2 卷积神经网络147
- 7.2.1 卷积的原理147
- 7.2.2 池化层的原理150
- 7.2.3 全连接层的原理150
- 7.2.4 一个经典的CNN网络结构152
- 7.3 手写数字分类项目153
- 7.3.1 训练环境的搭建153
- 7.3.2 训练数据的准备154
- 7.3.3 训练网络的搭建155
- 7.3.4 训练代码158
- 7.3.5 深度学习基础知识扩展159
- 7.4 基于深度学习的人脸识别解决方案161
- 7.4.1 数据的准备161
- 7.4.2 数据集的读取和处理163
- 7.4.3 网络的搭建165
- 7.4.4 Model的训练过程167
- 7.4.5 Model的测试过程168
- 7.5 本章小结169
- 第8章 Penta Kill:人脸图像美颜算法项目实战170
- 8.1 人脸磨皮算法171
- 8.1.1 图像滤波算法和效果171
- 8.1.2 人脸磨皮算法设计176
- 8.2 图像的色彩空间180
- 8.2.1 RGB和HSV色彩空间基础知识180
- 8.2.2 RGB和HSV转换的数学描述和函数实现180
- 8.2.3 图片中的颜色检测181
- 8.3 人脸美白算法设计183
- 8.3.1 通过图层混合实现图像美白算法184
- 8.3.2 通过beta参数调整实现图像美白算法185
- 8.3.3 通过颜色查找表实现图像美白算法187
- 8.4 人脸的手动祛痘算法设计189
- 8.4.1 图像修复算法介绍190
- 8.4.2 图像修复的原理190
- 8.4.3 通过图像修复算法实现手动祛痘191
- 8.5 本章小结193
- 第9章 Legendary:AI时代图像算法应用新生态194
- 9.1 抖音中的图像技术195
- 9.1.1 抖音中的图像应用概览195
- 9.1.2 抖音中的人脸检测技术195
- 9.1.3 抖音中的人脸检测技术应用197
- 9.1.4 抖音中的人体检测技术201
- 9.1.5 抖音中的人体检测技术应用201
- 9.1.6 抖音中的视频技术202
- 9.1.7 抖音中的图像技术总结205
- 9.2 美颜和美妆类App中的图像技术206
- 9.2.1 美颜和美妆类App图像应用概览207
- 9.2.2 五官的调整207
- 9.2.3 美妆算法208
- 9.2.4 染发算法209
- 9.2.5 五官分析211
- 9.2.6 美颜相机和美妆相机中图像技术的一些总结213
- 9.3 电商中的图像技术213
- 9.3.1 电商中的图像技术应用概览213
- 9.3.2 虚拟穿戴技术和商品3D展示214
- 9.3.3 尺寸测量214
- 9.3.4 相似商品推荐及以图搜图215
- 9.4 本章小结216