编辑推荐
适读人群 :本书同时覆盖深度学习的方法和实践,主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程或附录中描述的线性代数、微分和概率基础。
目前市面上有关深度学习介绍的书籍大多可分两类,一类侧重方法介绍,另一类侧重实践和深度学习工具的介绍。本书同时覆盖方法和实践。本书不仅从数学的角度阐述深度学习的技术与应用,还包含可运行的代码,为读者展示如何在实际中解决问题。为了给读者提供一种交互式的学习体验,本书不但提供免费的教学视频和讨论区,而且提供可运行的Jupyter记事本文件,充分利用Jupyter记事本能将文字、代码、公式和图像统一起来的优势。这样不仅直接将数学公式对应成实际代码,而且可以修改代码、观察结果并及时获取经验,从而带给读者全新的、交互式的深度学习的学习体验。
本书面向希望了解深度学习,特别是对实际使用深度学习感兴趣的大学生、工程师和研究人员。本书不要求读者有任何深度学习或者机器学习的背景知识,读者只需具备基本的数学和编程知识,如基础的线性代数、微分、概率及Python编程知识。本书的附录中提供了书中涉及的主要数学知识,供读者参考。
本书的英文版Dive into Deep Learning是加州大学伯克利分校2019年春学期“Introduction to Deep Learning”(深度学习导论)课程的教材。截至2019年春学期,本书中的内容已被全球15 所知名大学用于教学。本书的学习社区、免费教学资源(课件、教学视频、更多习题等),以及用于本书学习和教学的免费计算资源(仅限学生和老师)的申请方法在本书配套网站zh.d2l.ai上发布。读者在阅读本书的过程中,如果对书中某节内容有疑惑,也可以扫一扫书中对应的二维码寻求帮助。
内容简介
本书旨在向读者交付有关深度学习的交互式学习体验。书中不仅阐述深度学习的算法原理,还演示它们的实现和运行。与传统图书不同,本书的每一节都是一个可以下载并运行的 Jupyter记事本,它将文字、公式、图像、代码和运行结果结合在了一起。此外,读者还可以访问并参与书中内容的讨论。
全书的内容分为3个部分:第一部分介绍深度学习的背景,提供预备知识,并包括深度学习基础的概念和技术;第二部分描述深度学习计算的重要组成部分,还解释近年来令深度学习在多个领域大获成功的卷积神经网络和循环神经网络;第三部分评价优化算法,检验影响深度学习计算性能的重要因素,并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。
本书同时覆盖深度学习的方法和实践,主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程或附录中描述的线性代数、微分和概率基础。
作者简介
阿斯顿.张(Aston Zhang),
美亚应用科学家,美国伊利诺伊大学香槟分校计算机科学博士,统计学和计算机科学双硕士。他专注于机器学习的研究,并在数个顶ji学术会议发表过论文。他担任过NeurIPS、ICML、KDD、WWW、WSDM、SIGIR、AAAI 等学术会议的程序委员或审稿人以及Frontiers in Big Data 期刊的编委。
李沐(Mu Li),
美亚首席科学家(Principal Scientist),加州大学伯克利分校客座助理教授,美国卡内基梅隆大学计算机系博士。他专注于分布式系统和机器学习算法的研究。他是深度学习框架MXNet 的作者之一。他曾任机器学习创业公司Marianas Labs 的CTO 和百度深度学习研究院的主任研发架构师。他在理论、机器学习、应用和操作系统等多个领域的顶ji学术会议(包括FOCS、ICML、NeurIPS、AISTATS、CVPR、KDD 、WSDM、OSDI)上发表过论文。
扎卡里.C. 立顿(Zachary C. Lipton),
美亚应用科学家,美国卡内基梅隆大学助理教授,美国加州大学圣迭戈分校博士。他专注于机器学习算法及其社会影响的研究,特别是在时序数据与序列决策上的深度学习。这类工作有着广泛的应用场景,包括医疗诊断、对话系统和产品推荐。他创立了博客“Approximately Correct”(approximatelycorrect.com)。
亚历山大.J. 斯莫拉(Alexander J. Smola),
美亚副总裁/ 杰出科学家,德国柏林工业大学计算机科学博士。他曾在澳大利亚国立大学、美国加州大学伯克利分校和卡内基梅隆大学任教。他发表了超过200 篇学术论文,并著有5 本书,其论文及书被引用超过10 万次。他的研究兴趣包括深度学习、贝叶斯非参数、核方法、统计建模和可扩展算法。
目录
- 对本书的赞誉
- 前言
- 如何使用本书
- 资源与支持
- 主要符号表
- 第1章深度学习简介1
- 小结8
- 练习8
- 第2章预备知识9
- 小结12
- 练习12
- 小结19
- 练习19
- 小结21
- 练习21
- 小结24
- 练习24
- 第3章深度学习基础25
- 小结30
- 练习30
- 小结34
- 练习34
- 小结38
- 练习38
- 小结42
- 练习42
- 小结45
- 练习45
- 小结49
- 练习49
- 小结50
- 练习50
- 小结55
- 练习55
- 小结57
- 练习57
- 小结58
- 练习58
- 小结65
- 练习65
- 小结70
- 练习70
- 小结74
- 练习74
- 小结77
- 练习77
- 小结78
- 练习79
- 小结85
- 练习85
- 第4章深度学习计算86
- 小结89
- 练习90
- 小结94
- 练习94
- 小结96
- 练习97
- 小结99
- 练习99
- 小结101
- 练习101
- 小结105
- 练习105
- 第5章卷积神经网络106
- 小结110
- 练习110
- 小结113
- 练习113
- 小结117
- 练习117
- 小结120
- 练习121
- 小结124
- 练习124
- 小结128
- 练习129
- 小结131
- 练习131
- 小结134
- 练习134
- 小结137
- 练习137
- 小结142
- 练习142
- 小结146
- 练习146
- 小结149
- 练习149
- 第6章循环神经网络150
- 小结152
- 练习152
- 小结155
- 练习155
- 小结158
- 练习159
- 小结164
- 练习164
- 小结168
- 练习168
- 小结170
- 练习170
- 小结176
- 练习176
- 小结181
- 练习182
- 小结183
- 练习183
- 小结184
- 练习184
- 第7章优化算法185
- 小结188
- 练习189
- 小结194
- 练习194
- 小结199
- 练习199
- 小结205
- 练习205
- 小结209
- 练习209
- 小结212
- 练习212
- 小结214
- 练习214
- 小结217
- 练习217
- 第8章计算性能218
- 小结224
- 练习224
- 小结229
- 练习229
- 小结231
- 练习231
- 小结237
- 练习237
- 小结241
- 练习241
- 第9章计算机视觉242
- 小结250
- 练习250
- 热狗识别251
- 小结255
- 练习255
- 边界框256
- 小结257
- 练习257
- 小结265
- 练习265
- 小结268
- 练习268
- 小结270
- 练习271
- 小结278
- 练习278
- 小结285
- 练习285
- 小结290
- 练习290
- 小结297
- 练习297
- 小结306
- 练习306
- 提交结果313
- 小结313
- 练习313
- 小结320
- 练习320
- 第10章自然语言处理321
- 小结325
- 练习325
- 小结327
- 练习328
- 小结336
- 练习336
- 小结337
- 练习337
- 小结340
- 练习340
- 小结343
- 练习343
- 小结347
- 练习347
- 小结353
- 练习353
- 小结355
- 练习355
- 小结358
- 练习358
- 小结361
- 练习361
- 小结369
- 练习369
- 附录A数学基础370
- 附录B使用Jupyter记事本376
- 附录C使用AWS运行代码381
- 附录DGPU购买指南388
- 附录E如何为本书做贡献391
- 附录Fd2lzh包索引395
- 附录G中英文术语对照表397
- 参考文献402
- 索引407