《深度学习与计算机视觉:算法原理、框架应用与代码实现》全面介绍了深度学习及计算机视觉中基础的知识,并结合常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。作为一本“原理+实践”教程,本书在讲解原理的基础上,通过有趣的实例带领读者一步步亲自动手,不断提高动手能力,而不是枯燥和深奥原理的堆砌。
全书共13章,分为2篇。第1篇基础知识,介绍了人工智能发展里程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,最后对最前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、最简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。从第5章开始包含了很多有趣和实用的代码示例。从第7章开始的所有实例都基于当前最流行的深度学习框架中的Caffe和MXNet,其中包含了作者原创的大量代码和搜集的数据,这些代码和作者训练好的部分模型已分享到本书github页面上供读者自行下载。
本书适合对人工智能、机器学习、深度学习和计算机视觉感兴趣的读者阅读。阅读本书要求读者具备一定的数学基础和基本的编程能力,并需要读者了解Linux的基本使用。
代码库地址:
https://github.com/frombeijingwithlove/dlcv_for_beginners
目录
- 第1篇 基础知识
- 第1章 引言 2
- 第2章 深度学习和计算机视觉中的基础数学知识 27
- 第3章 神经网络和机器学习基础 87
- 第4章 深度卷积神经网络 120
- 第2篇 实例精讲
- 第5章 Python基础 148
- 第6章 OpenCV基础 182
- 第7章 Hello World! 212
- 第8章 最简单的图片分类——手写数字识别 227
- 第9章 利用Caffe做回归 249
- 第10章 迁移学习和模型微调 264
- 第11章 目标检测 288
- 第12章 度量学习 304
- 第13章 图像风格迁移 317