《自然语言处理实战:利用Python理解、分析和生成文本》是由人民邮电出版社出版的一本关于自然语言方面的书籍,作者是霍布森·莱恩,主要介绍了关于自然语言、Python方面的知识内容,目前在自然语言类书籍综合评分为:8.9分。
书籍介绍
《自然语言处理实战:利用Python理解、分析和生成文本》是介绍自然语言处理(NLP)和深度学习的实战书。NLP已成为深度学习的核心应用领域,而深度学习是NLP研究和应用中的必要工具。本书分为3部分:*部分介绍NLP基础,包括分词、TF-IDF向量化以及从词频向量到语义向量的转换;第二部分讲述深度学习,包含神经网络、词向量、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆(LSTM)网络、序列到序列建模和注意力机制等基本的深度学习模型和方法;第三部分介绍实战方面的内容,包括信息提取、问答系统、人机对话等真实世界系统的模型构建、性能挑战以及应对方法。
本书面向中高级Python开发人员,兼具基础理论与编程实战,是现代NLP领域从业者的实用参考书。
Python开发人员入门自然语言处理必备
现代自然语言处理领域从业者的实用参考指南
小米AI实验室NLP团队献译
1.本书是构建能够阅读和解释人类语言的机器的实用指南;
2.读者可以使用现有的Python 包来捕获文本的含义并相应地做出响应;
3.本书扩展了传统的自然语言处理方法,包括神经网络、现代深度学习算法和生成技术,用于解决真实世界的问题,如提取日期和名称、合成文本和回答无固定格式的问题;
4.提供源代码。
深度学习领域的*进展使各类应用能够极其精准地理解文本和语音。其结果是,聊天机器人能够模仿真人筛选出与职位高度匹配的简历,完成卓越的预测性搜索,自动生成文档摘要——所有这些都能够以很低的成本实现。新技术的发展连同Keras 和TensorFlow之类的易用工具的出现,使专业品质的自然语言处理(NLP)比以往任何时候都更容易实现。
本书主要内容
● Keras、TensorFlow、gensim和 scikit-learn等工具的使用。
● 基于规则的自然语言处理和基于数据的自然语言处理。
● 可扩展的自然语言处理流水线。
阅读本书,读者需要对深度学习的知识有基本的了解,并具有中等水平的Python 编程技能。
目录
- 第 一部分 处理文本的机器
- 第 1章 NLP概述 3
- 第 2章 构建自己的词汇表——分词 27
- 第3章 词中的数学 62
- 第4章 词频背后的语义 87
- 第二部分 深度学习(神经网络)
- 第5章 神经网络初步(感知机与反向传播) 139
- 第6章 词向量推理(Word2vec) 160
- 第7章 卷积神经网络(CNN) 191
- 第8章 循环神经网络(RNN) 215
- 第9章 改进记忆力:长短期记忆网络(LSTM) 239
- 第 10章 序列到序列建模和注意力机制 272
- 第三部分 进入现实世界(现实中的NLP挑战)
- 第 11章 信息提取(命名实体识别与问答系统) 297
- 第 12章 开始聊天(对话引擎) 320
- 第 13章 可扩展性(优化、并行化和批处理) 353
- 附录A 本书配套的NLP工具 373
- 附录B 有趣的Python和正则表达式 380
- 附录C 向量和矩阵(线性代数基础) 385
- 附录D 机器学习常见工具与技术 391
- 附录E 设置亚马逊云服务(AWS)上的GPU 403
- 附录F 局部敏感哈希 415
- 资源 421
- 词汇表 428