本书从基础知识入手,详细讲解通过强化学习和深度学习构建AI系统所需的一切,并通过5个完整的项目实例,循序渐进展示如何使用最佳、最简单的AI编程工具(包括Python、TensorFlow、Keras和PyTorch)构建智能软件。具体内容包括AI工具包、Python基础、AI基础技巧、你的第一个AI模型、销售和广告中的AI、Q学习、物流行业中的AI、人工大脑、自动驾驶车辆中的AI、商业中的AI、深度卷积Q学习、游戏中的AI。
封面图
目录
- 译者序
- 前言
- 作者简介
- 审校者简介
- 第1章欢迎来到机器人世界1
- 1.1开始你的AI旅程1
- 1.2四种不同的AI模型2
- 1.3学习AI可以让你做什么3
- 1.4小结5
- 第2章探索你的AI工具包6
- 2.1GitHub源代码页面6
- 2.2Colaboratory 运行环境7
- 2.3小结11
- 第3章Python基础——学习如何用Python编程12
- 3.1显示文本13
- 3.2变量和操作13
- 3.3列表和数组14
- 3.4if语句和条件16
- 3.5for循环和while循环17
- 3.6函数21
- 3.7类和对象22
- 3.8小结24
- 第4章AI基础技巧25
- 4.1什么是强化学习25
- 4.2强化学习的五大原理26
- 4.2.1原理#1——输入与输出系统26
- 4.2.2原理#2——奖励27
- 4.2.3原理#3——AI环境27
- 4.2.4原理#4——马尔可夫决策过程28
- 4.2.5原理#5——训练与推断28
- 4.3小结30
- 第5章你的第一个AI模型——小心老虎机31
- 5.1多臂老虎机问题31
- 5.2汤普森采样模型32
- 5.2.1模型编程32
- 5.2.2理解模型36
- 5.2.3什么是分布37
- 5.2.4应对多臂老虎机问题39
- 5.2.5汤普森采样策略三步走41
- 5.2.6汤普森采样模型的临门一脚42
- 5.2.7汤普森采样模型与标准模型42
- 5.3小结44
- 第6章销售和广告中的AI——像“AI街之狼”一样销售45
- 6.1待解决的问题45
- 6.2用仿真构建AI环境47
- 6.2.1运行仿真程序48
- 6.2.2回顾50
- 6.3AI解决方案及其直觉的回顾50
- 6.3.1AI解决方案51
- 6.3.2直觉51
- 6.4技术实现52
- 6.4.1汤普森采样与随机策略选择52
- 6.4.2开始编程52
- 6.4.3最终结果57
- 6.5小结58
- 第7章欢迎来到Q学习59
- 7.1迷宫59
- 7.1.1第一步60
- 7.1.2构建环境61
- 7.1.3构建AI模型64
- 7.2Q学习的完整流程66
- 7.2.1训练模式66
- 7.2.2推断模式67
- 7.3小结67
- 第8章物流行业中的AI——仓库中的机器人68
- 8.1构建环境69
- 8.1.1状态70
- 8.1.2行为70
- 8.1.3奖励70
- 8.1.4AI解决方案回顾70
- 8.2技术实现71
- 8.2.1第1部分——构建环境72
- 8.2.2第2部分——用Q学习构建AI解决方案74
- 8.2.3第3部分——进入推断模式75
- 8.2.4改进1——自动化奖励分配77
- 8.2.5改进2——加入一个中间目标80
- 8.3小结82
- 第9章人工大脑——深度Q学习83
- 9.1预测房价83
- 9.1.1上传数据集84
- 9.1.2导入依赖库85
- 9.1.3排除变量86
- 9.1.4准备数据87
- 9.1.5构建神经网络90
- 9.1.6训练神经网络91
- 9.1.7展示结果91
- 9.2深度学习理论92
- 9.2.1神经元92
- 9.2.2激活函数95
- 9.2.3神经网络的工作原理98
- 9.2.4神经网络如何学习98
- 9.2.5正向传播算法和反向传播算法99
- 9.2.6梯度下降算法100
- 9.3深度Q学习106
- 9.3.1归一化指数方法107
- 9.3.2深度Q学习回顾108
- 9.3.3经验回放109
- 9.3.4深度Q学习的完整算法109
- 9.4小结110
- 第10章自动驾驶汽车中的AI——造一辆自动驾驶汽车111
- 10.1构建环境111
- 10.1.1设定目标113
- 10.1.2设置参数116
- 10.1.3输入状态118
- 10.1.4输出行为119
- 10.1.5奖励120
- 10.2AI解决方案回顾122
- 10.3技术实现123
- 10.3.1第1步——导入依赖库123
- 10.3.2第2步——创造神经网络的架构124
- 10.3.3第3步——实现经验回放127
- 10.3.4第4步——实现深度Q学习130
- 10.4演示138
- 10.4.1安装Anaconda139
- 10.4.2用Python 3.6创建一个虚拟环境140
- 10.4.3安装PyTorch142
- 10.4.4安装Kivy143
- 10.5小结151
- 第11章商业中的AI——用深度Q学习使成本最小化152
- 11.1要解决的问题152
- 11.2构建环境153
- 11.2.1服务器环境中的常量和变量153
- 11.2.2关于服务器环境的假设154
- 11.2.3仿真155
- 11.2.4整体功能156
- 11.2.5定义状态157
- 11.2.6定义行为158
- 11.2.7定义奖励158
- 11.2.8最后的仿真示例159
- 11.3AI解决方案161
- 11.3.1大脑162
- 11.3.2技术实现163
- 11.4演示191
- 11.5回顾——通用AI框架/蓝图199
- 11.6小结200
- 第12章深度卷积Q学习201
- 12.1CNN有什么用途201
- 12.2CNN的工作原理202
- 12.2.1第1步——卷积204
- 12.2.2第2步——最大池化206
- 12.2.3第3步——扁平化209
- 12.2.4第4步——全连接210
- 12.3深度卷积Q学习211
- 12.4小结212
- 第13章游戏中的AI——成为《贪吃蛇》大师213
- 13.1要解决的问题213
- 13.2构建环境214
- 13.2.1定义状态214
- 13.2.2定义行为215
- 13.2.3定义奖励216
- 13.3AI解决方案216
- 13.3.1大脑217
- 13.3.2经验回放记忆218
- 13.4技术实现219
- 13.4.1第1步——构建环境219
- 13.4.2第2步——构建大脑226
- 13.4.3第3步——构建经验回放记忆228
- 13.4.4第4步——训练AI模型230
- 13.4.5第5步——测试AI模型235
- 13.5演示237
- 13.5.1安装237
- 13.5.2结果242
- 13.6小结243
- 第14章回顾与总结244
- 14.1回顾——整体AI框架/蓝图244
- 14.2探索你在AI领域的下一站245
- 14.2.1不断练习246
- 14.2.2社交247
- 14.2.3学无止境247