内容介绍
图像搜索引擎有两种实现方式—基于图像上下文文本特征的方式和基于图像视觉内容特征的方式。本书所指的图像搜索引擎是基于内容特征的图像检索,也就是通常所说的“以图搜图”来检索相似图片。本书主要讲解了搜索引擎技术的发展脉络、文本搜索引擎的基本原理和搜索引擎的一般结构,详细讲述了图像搜索引擎各主要组成部分的原理和实现,并构建了一个基于深度学习的Web图像搜索引擎。
作者介绍
明恒毅,软件工程师。长期从事信息系统的设计、开发、管理、运维工作,擅长图像处理、图像检索、搜索引擎、深度学习等领域的理论与技术应用实践,热衷于研究前沿软件技术及思想。曾在其主持研发的视频监控检索系统、融合通信智能应答系统等项目中积极运用AI技术,并取得了良好的效果。
目录
- 第 1章 从文本搜索到图像搜索 1
- 1.1 文本搜索引擎的发展 1
- 1.2 文本搜索引擎的结构与实现 2
- 1.2.1 文本预处理 3
- 1.2.2 建立索引 5
- 1.2.3 对索引进行搜索 7
- 1.3 搜索引擎的一般结构 10
- 1.4 从文本到图像 10
- 1.5 现有图像搜索引擎介绍 12
- 1.5.1 Google图像搜索引擎 12
- 1.5.2 百度图像搜索引擎 13
- 1.5.3 TinEye图像搜索引擎 14
- 1.5.4 *图像搜索引擎 15
- 1.6 本章小结 16
- 第 2章 传统图像特征提取 17
- 2.1 人类怎样获取和理解一幅图像 17
- 2.2 计算机怎样获取和表示一幅图像 18
- 2.2.1 采样 18
- 2.2.2 量化 19
- 2.2.3 数字图像的存储 19
- 2.2.4 常用的位图格式 20
- 2.2.5 色彩空间 20
- 2.2.6 图像基本操作 21
- 2.3 图像特征的分类 29
- 2.4 全局特征 30
- 2.4.1 颜色特征 30
- 2.4.2 纹理特征 41
- 2.4.3 形状特征 67
- 2.5 局部特征 82
- 2.5.1 SIFT描述符 82
- 2.5.2 SURF描述符 86
- 2.6 本章小结 88
- 第3章 深度学习图像特征提取 89
- 3.1 深度学习 89
- 3.1.1 神经网络的发展 89
- 3.1.2 深度神经网络的突破 92
- 3.1.3 主要的深度神经网络模型 95
- 3.2 深度学习应用框架 97
- 3.2.1 TensorFlow 97
- 3.2.2 Torch 98
- 3.2.3 Caffe 98
- 3.2.4 Theano 98
- 3.2.5 Keras 99
- 3.2.6 DeepLearning4J 99
- 3.3 卷积神经网络 99
- 3.3.1 卷积 99
- 3.3.2 卷积神经网络概述 103
- 3.3.3 经典卷积神经网络结构 110
- 3.3.4 使用卷积神经网络提取图像特征 130
- 3.3.5 使用迁移学习和微调技术进一步提升提取特征的精度 134
- 3.4 本章小结 141
- 第4章 图像特征索引与检索 142
- 4.1 图像特征降维 142
- 4.1.1 主成分分析算法降维 142
- 4.1.2 深度自动编码器降维 150
- 4.2 图像特征标准化 153
- 4.2.1 离差标准化 153
- 4.2.2 标准差标准化 153
- 4.3 图像特征相似度的度量 154
- 4.3.1 欧氏距离 154
- 4.3.2 曼哈顿距离 155
- 4.3.3 海明距离 155
- 4.3.4 余弦相似度 155
- 4.3.5 杰卡德相似度 156
- 4.4 图像特征索引与检索 157
- 4.4.1 从*近邻(NN)到K*近邻(KNN) 157
- 4.4.2 索引构建与检索 158
- 4.5 本章小结 173
- 第5章 构建一个基于深度学习的Web图像搜索引擎 174
- 5.1 架构分析与技术路线 174
- 5.1.1 架构分析 174
- 5.1.2 技术路线 175
- 5.2 程序实现 175
- 5.2.1 开发环境搭建 175
- 5.2.2 项目实现 176
- 5.3 优化策略 204
- 5.4 本章小结 205