生成对抗网络毫无疑问是2018年最热门的人工智能技术之一,被美国《麻省理工科技评论》评选为2018年“全球十大突破性技术”。《生成对抗网络入门指南》是一本结合基础理论与工程实践的入门型书籍,深入浅出地讲解了生成对抗网络的各类模型以及技术发展。本书面向机器学习从业人员、在校相关专业学生以及具备一定基础的人工智能领域爱好者。通过本书的学习,能够了解生成对抗网络的技术原理,并通过书中的代码实例深入技术细节。本书共分10个章节,其中前半部分分别介绍了目前研究领域已经较为成熟的生成对抗网络模型,比如DCGAN、WGAN等等,以及大量不同结构的生成对抗网络变种。本书后半部分介绍了生成对抗网络在文本到图像的生成、图像到图像的生成以及其它应用中的研究与发展。希望本书能够帮助广大读者跟上人工智能技术的潮流,成为AI时代的先行者。
封面图
目录
- 前言
- 第1章人工智能入门 1
- 1.1人工智能的历史与发展 1
- 1.1.1人工智能的诞生 3
- 1.1.2人工智能的两起两落 6
- 1.1.3新时代的人工智能 7
- 1.2机器学习与深度学习 10
- 1.2.1机器学习分类 11
- 1.2.2神经网络与深度学习 12
- 1.2.3深度学习的应用 13
- 1.3了解生成对抗网络 15
- 1.3.1从机器感知到机器创造 15
- 1.3.2什么是生成对抗网络 19
- 1.4本章小结 20
- 第2章预备知识与开发工具 21
- 2.1Python语言与开发框架 21
- 2.1.1Python语言 21
- 2.1.2常用工具简介 23
- 2.1.3第三方框架简介 26
- 2.2TensorFlow基础入门 27
- 2.2.1TensorFlow简介与安装 27
- 2.2.2TensorFlow使用入门 30
- 2.2.3Tensorflow实例:图像分类 31
- 2.3Keras基础入门 33
- 2.3.1Keras简介与安装 33
- 2.3.2Keras使用入门 34
- 2.3.3Keras实例:文本情感分析 36
- 2.4Floyd:使用深度学习云平台运行程序 38
- 2.4.1深度学习云平台简介 38
- 2.4.2Floyd使用入门 39
- 2.4.3Floyd实例:神经网络风格转换 43
- 2.5本章小结 45
- 第3章理解生成对抗网络 46
- 3.1生成模型 46
- 3.1.1生成模型简介 46
- 3.1.2自动编码器 47
- 3.1.3变分自动编码器 50
- 3.2GAN的数学原理 52
- 3.2.1最大似然估计 52
- 3.2.2生成对抗网络的数学推导 55
- 3.3GAN的可视化理解 58
- 3.4GAN的工程实践 59
- 3.5本章小结 67
- 第4章深度卷积生成对抗网络 68
- 4.1DCGAN的框架 68
- 4.1.1DCGAN设计规则 68
- 4.1.2DCGAN框架结构 72
- 4.2DCGAN的工程实践 73
- 4.3DCGAN的实验性应用 79
- 4.3.1生成图像的变换 79
- 4.3.2生成图像的算术运算 81
- 4.3.3残缺图像的补全 83
- 4.4本章小结 85
- 第5章Wasserstein GAN 86
- 5.1GAN的优化问题 86
- 5.2WGAN的理论研究 89
- 5.3WGAN的工程实践 92
- 5.4WGAN的实验效果分析 96
- 5.4.1代价函数与生成质量的相关性 96
- 5.4.2生成网络的稳定性 97
- 5.4.3模式崩溃问题 99
- 5.5WGAN的改进方案:WGAN-GP 100
- 5.6本章小结 104
- 第6章不同结构的GAN 105
- 6.1GAN与监督式学习 105
- 6.1.1条件式生成:cGAN 105
- 6.1.2cGAN在图像上的应用 106
- 6.2GAN与半监督式学习 110
- 6.2.1半监督式生成:SGAN 110
- 6.2.2辅助分类生成:ACGAN 112
- 6.3GAN与无监督式学习 113
- 6.3.1无监督式学习与可解释型特征 113
- 6.3.2理解InfoGAN 115
- 6.4本章小结 119
- 第7章文本到图像的生成 120
- 7.1文本条件式生成对抗网络 120
- 7.2文本生成图像进阶:GAWWN 123
- 7.3文本到高质量图像的生成 127
- 7.3.1层级式图像生成:StackGAN 128
- 7.3.2层级式图像生成的优化:StackGAN-v2 132
- 7.4本章小结 135
- 第8章图像到图像的生成 136
- 8.1可交互图像转换:iGAN 136
- 8.1.1可交互图像转换的用途 136
- 8.1.2iGAN的实现方法 138
- 8.1.3iGAN软件简介与使用方法 140
- 8.2匹配数据图像转换:Pix2Pix 143
- 8.2.1理解匹配数据的图像转换 143
- 8.2.2Pix2Pix的理论基础 145
- 8.2.3Pix2Pix的应用实践 150
- 8.3非匹配数据图像转换:CycleGAN 157
- 8.3.1理解非匹配数据的图像转换 157
- 8.3.2CycleGAN的理论基础 160
- 8.3.3CycleGAN的应用实践 162
- 8.4多领域图像转换:StarGAN 166
- 8.4.1多领域的图像转换问题 166
- 8.4.2StarGAN的理论基础 169
- 8.4.3StarGAN的应用实践 171
- 8.5本章小结 177
- 第9章GAN的应用:从多媒体到艺术设计 178
- 9.1GAN在多媒体领域的应用 178
- 9.1.1图像去模糊 178
- 9.1.2人脸生成 181
- 9.1.3音频合成 184
- 9.2GAN与AI艺术 188
- 9.2.1AI能否创造艺术 188
- 9.2.2AI与计算机艺术的发展 190
- 9.2.3艺术生成网络:从艺术模仿到创意生成 196
- 9.3GAN与AI设计 202
- 9.3.1AI时代的设计 202
- 9.3.2AI辅助式设计的研究 205
- 9.4本章小结 212
- 第10章GAN研究热点 213
- 10.1评估与优化 213
- 10.2对抗攻击 216
- 10.3发展中的GAN 219
- 参考文献 222