《中文信息处理丛书:统计自然语言处理(第2版)》全方位详细介绍了统计自然语言解决的基本要素、基础理论方式 和*研究成果,內容包含形式语言与自动机以及在自然语言解决中的运用、语言模型、隐马尔可夫实体模型、词库技术性、中文全自动词性标注与词性标注、句法分析、词意消歧、章节剖析、统计翻译机器、在线翻译、文本分类、信息搜索与问答网站、全自动摘要和信息抽取、英语口语信息资源管理与人机对换系统软件等,具有对基本知识和理论模型的详细介绍,也是有对相关难题的选题背景、完成方式 和技术性现况的详尽论述。
《中文信息处理丛书:统计自然语言处理(第2版)》可做为高等学校电子计算机、信息科技等相关技术专业的高学段本科毕业或硕士研究生的教材内容或教材,也能够从业自然语言解决、大数据挖掘和人工智能技术等科学研究的相关工作人员参照。
目录
- 第1章 绪论
- 1.1 基本概念
- 1.1.1 语言学与语音学
- 1.1.2 自然语言处理
- 1.1.3 关于“理解”的标准
- 1.2 自然语言处理研究的内容和面临的困难
- 1.2.1 自然语言处理研究的内容
- 1.2.2 自然语言处理涉及的几个层次
- 1.2.3 自然语言处理面临的困难
- 1.3 自然语言处理的基本方法及其发展
- 1.3.1 自然语言处理的基本方法
- 1.3.2 自然语言处理的发展
- 1.4 自然语言处理的研究现状
- 1.5 本书的内容安排
- 第2章 预备知识
- 2.1 概率论基本概念
- 2.1.1 概率
- 2.1.2 最大似然估计
- 2.1.3 条件概率
- 2.1.4 贝叶斯法则
- 2.1.5 随机变量
- 2.1.6 二项式分布
- 2.1.7 联合概率分布和条件概率分布
- 2.1.8 贝叶斯决策理论
- 2.1.9 期望和方差
- 2.2 信息论基本概念
- 2.2.1 熵
- 2.2.2 联合熵和条件熵
- 2.2.3 互信息
- 2.2.4 相对熵
- 2.2.5 交叉熵
- 2.2.6 困惑度
- 2.2.7 噪声信道模型
- 2.3 支持向量机
- 2.3.1 线性分类
- 2.3.2 线性不可分
- 2.3.3 构造核函数
- 第3章 形式语言与自动机
- 3.1 基本概念
- 3.1.1 图
- 3.1.2 树
- 3.1.3 字符串
- 3.2 形式语言
- 3.2.1 概述
- 3.2.2 形式语法的定义
- 3.2.3 形式语法的类型
- 3.2.4 CFG识别句子的派生树表示
- 3.3 自动机理论
- 3.3.1 有限自动机
- 3.3.2 正则文法与自动机的关系
- 3.3.3 上下文无关文法与下推自动机
- 3.3.4 图灵机
- 3.3.5 线性界限自动机
- 3.4 自动机在自然语言处理中的应用
- 3.4.1 单词拼写检查
- 3.4.2 单词形态分析
- 3.4.3 词性消歧
- 第4章 语料库与语言知识库
- 4.1 语料库技术
- 4.1.1 概述
- 4.1.2 语料库语言学的发展
- 4.1.3 语料库的类型
- 4.1.4 汉语语料库建设中的问题
- 4.1.5 典型语料库介绍
- ……
- 第5章 语言模型
- 第6章 概率图模型
- 第7章 自动分词、命名实体识别与词性标注
- 第8章 句法分析
- 第9章 语义分析
- 第10章 篇章分析
- 第11章 统计机器翻译
- 第12章 语音翻译
- 第13章 文本分类与情感分类
- 第14章 信息检索与问答系统
- 第15章 自动文摘与信息抽取
- 第16章 口语信息处理与人机对话系统
- 参考文献
- 自然语言处理及其相关领域的国际会议
- 名词术语索引