编辑推荐
由R知名专家执笔。作者深入理解了R的内涵和精髓,结合自己丰富的培训经验,以及大量的一线工程实践经验,潜心编写而成。
软件版本采用当前新的R版本,在知识点讲解过程中穿插了新功能的讲述与应用。
知识全面、系统,科学安排内容的层次架构,由浅入深,循序渐进,适合读者的学习规律。
理论与实践应用紧密结合。基础理论知识穿插在知识点的讲述中,言简意赅、目标明确,其目的是使读者知其然,亦知其所以然,达到学以致用的目的。
知识点+针对每个知识点的小实例+综合实例的讲述方式,可以使读者快速地学习并掌握R软件操作及应用该知识点解决实践中的问题。综合实例部分,深入细致地剖析数据统计分析应用的流程、细节、难点、技巧,起到融会贯通的作用。
为了让本书内容尽可能接近各个领域的实际情况,作者从心理学、社会学、医学、生物、商业和工程等诸多领域选取了一些例子。所有的这些例子都不需要读者具备这些领域的专业知识。
本书附带所有实例操作的数据和R程序。
内容简介
R统计软件是目前应用很广泛的统计软件之一,已广泛应用于医学、财经和社会科学等领域中进行数据管理和数据分析处理。本书以Windows操作系统下的R软件为基础,以实践中常用的统计分析方法为基本内容,介绍了R语言的编写以及结果解释。本书重点介绍了各种多元统计分析方法的基本原理及其应用,包括方差分析、多元线性回归、Logistic回归分析、生存分析、主成分分析、因子分析、聚类分析、判别分析以及典型相关分析等。每一章详细讨论了统计分析方法的基本原理和分析过程,介绍了R语言的使用方法及应用实例说明、结果解释及结论分析等。
作者简介
本书由汪海波、罗莉、汪海玲编著,参与编写的还有郝旭宁、李建鹏、赵伟茗、刘钦、于志伟、张永岗、周世宾、姚志伟、曹文平、张应迁、张洪才、邱洪钢、张青莲、陆绍强、李成。
汪海波,SAS知名专家,畅销书《SAS统计分析与应用从入门到精通》作者。作者深入理解了SAS内涵、精髓,结合自己丰富的工作经验,并结合大量的一线工程实践经验,潜心编写而成。
目录
- 第一篇 R基础与入门篇
- 第1章 R入门 2
- 1.1 R简介 2
- 1.1.1 R特点 2
- 1.1.2 R支持资料 3
- 1.2 R的获取、安装和启动 4
- 1.2.1 R的获取 4
- 1.2.2 R的安装 5
- 1.2.3 R的启动 7
- 1.3 R菜单操作 7
- 1.4 工作空间 10
- 1.5 程序包 11
- 1.5.1 什么是程序包 11
- 1.5.2 安装程序包 11
- 1.6 R使用以及图形界面 12
- 1.7 本章小结 13
- 第2章 R编程入门 14
- 2.1 R语言 14
- 2.1.1 数据集的概念 14
- 2.1.2 R运算符 21
- 2.2 R常用函数及其应用 23
- 2.2.1 数学函数 24
- 2.2.2 样本统计函数 26
- 2.2.3 概率函数 27
- 2.2.4 字符处理函数 28
- 2.2.5 其他实用函数 30
- 2.3 数据的输入 31
- 2.3.1 使用键盘输入数据 31
- 2.3.2 数据集的导入 32
- 2.4 本章小结 34
- 第3章 基本数据管理 35
- 3.1 创建新变量 36
- 3.2 向量运算 37
- 3.2.1 添加或删除向量元素 37
- 3.2.2 向量运算和逻辑运算 37
- 3.2.3 用∶运算符创建向量 37
- 3.2.4 使用seq()函数创建向量 38
- 3.3 处理数据对象的实用函数 38
- 3.4 变量的重编码 39
- 3.5 变量的重命名 40
- 3.6 缺失值 41
- 3.7 日期值 42
- 3.8 类型转换 44
- 3.9 数据排序 45
- 3.10 数据集的合并 45
- 3.11 数据集取子集 46
- 3.11.1 选入观测 46
- 3.11.2 选入变量 47
- 3.11.3 剔除变量 48
- 3.11.4 subset()函数 49
- 3.12 本章小结 49
- 第4章 样本量和检验效能估计 50
- 4.1 样本量估算以及R程序包 50
- 4.1.1 样本量影响因素 50
- 4.1.2 检验效能分析pwr包 52
- 4.2 t检验 53
- 4.2.1 单样本与已知总体检验时样本量的估计及R程序 53
- 4.2.2 两总体均数比较样本量的估计及R程序 54
- 4.2.3 配对设计两样本均数比较样本量的估计及R程序 55
- 4.3 方差分析 56
- 4.4 相关分析 57
- 4.5 线性模型 58
- 4.6 分类资料的样本量估计 59
- 4.6.1 单样本与已知总体检验时样本量的估计及R程序 59
- 4.6.2 两样本率比较样本量的估计及R程序 60
- 4.6.3 配对设计总体率比较样本量的估计及R程序 61
- 4.7 本章小结 62
- 第5章 高 级数据管理 63
- 5.1 控制语句 63
- 5.1.1 重复和循环 63
- 5.1.2 条件执行 65
- 5.2 数据处理综合实例 67
- 5.3 转置与整合 70
- 5.3.1 转置 70
- 5.3.2 整合数据 71
- 5.4 本章小结 72
- 第二篇 统计方法与R分析实例
- 第6章 定量资料的统计描述 74
- 6.1 统计描述基础理论知识 74
- 6.1.1 集中趋势描述 75
- 6.1.2 离散趋势描述 77
- 6.1.3 正态分布 79
- 6.2 统计描述分析实例 81
- 6.2.1 summary()函数分析实例 81
- 6.2.2 sapply()函数分析实例 83
- 6.2.3 describe()函数分析实例 85
- 6.2.4 stat.desc()函数分析实例 89
- 6.2.5 分组计算描述性统计量 91
- 6.2.6 对数正态分布资料的统计描述 94
- 6.3 本章小结 95
- 第7章 t检验 96
- 7.1 单样本t检验 96
- 7.1.1 单样本t检验的基础理论 96
- 7.1.2 单样本t检验分析实例 97
- 7.1.3 无原始数据的单样本t检验R程序 98
- 7.2 配对设计资料的t检验 98
- 7.2.1 配对设计资料t检验的基础理论 98
- 7.2.2 配对t检验实例 100
- 7.2.3 无原始数据的配对设计的t检验分析实例 102
- 7.3 两独立样本的t检验 103
- 7.3.1 两独立样本t检验的基础理论 103
- 7.3.2 独立样本t检验分析实例 105
- 7.3.3 无原始数据的两独立样本t检验分析实例 107
- 7.4 本章小结 107
- 第8章 方差分析 108
- 8.1 方差分析及ANOVA模型拟合概述 108
- 8.1.1 方差分析的基本思想 108
- 8.1.2 方差分析基本术语 110
- 8.1.3 ANOVA模型拟合 111
- 8.2 完全随机设计资料的方差分析 112
- 8.2.1 单因子方差分析介绍 113
- 8.2.2 单因子方差分析的R程序实例 113
- 8.3 随机区组设计资料的方差分析 118
- 8.3.1 随机区组方差分析介绍 119
- 8.3.2 随机区组方差分析的R程序实例 121
- 8.4 拉丁方设计资料的方差分析 126
- 8.4.1 拉丁方方法介绍 126
- 8.4.2 拉丁方分析的R程序实例 128
- 8.5 析因设计资料的方差分析 131
- 8.5.1 析因设计方法介绍 131
- 8.5.2 析因方差分析的R程序实例 134
- 8.6 正交试验设计资料的方差分析 136
- 8.6.1 正交试验设计方法介绍 136
- 8.6.2 正交试验设计资料分析的R程序实例 138
- 8.7 重复测量资料的方差分析 139
- 8.7.1 重复测量设计方法介绍 140
- 8.7.2 重复测量资料分析的R程序实例 141
- 8.8 协方差分析 144
- 8.8.1 协方差分析方法介绍 144
- 8.8.2 协方差分析的R程序实例 145
- 8.9 本章小结 148
- 第9章 直线回归与相关 149
- 9.1 直线相关分析 149
- 9.1.1 直线相关分析介绍 149
- 9.1.2 直线相关分析的R实例 151
- 9.2 直线回归分析 154
- 9.2.1 直线回归分析介绍 155
- 9.2.2 直线回归分析的R程序实例 157
- 9.3 本章小结 162
- 第10章 多元线性回归与相关 163
- 10.1 多元线性回归与相关的基础理论 163
- 10.1.1 多元线性回归 163
- 10.1.2 复相关系数与偏相关系数 176
- 10.2 分析实例 178
- 10.2.1 多元线性回归方程的建立 178
- 10.2.2 复相关系数与偏相关系数的R程序实例 183
- 10.3 本章小结 185
- 第11章 Logistic回归分析 186
- 11.1 非条件Logistic回归 186
- 11.1.1 非条件Logistic回归介绍 187
- 11.1.2 非条件Logistic回归模型的建立和检验 188
- 11.1.3 非条件Logistic回归的R程序 190
- 11.2 条件Logistic回归 205
- 11.2.1 条件Logistic回归介绍 205
- 11.2.2 条件Logistic回归的R程序 206
- 11.3 本章小结 207
- 第12章 相对数 208
- 12.1 相对数简介 208
- 12.1.1 率的标准化 210
- 12.1.2 率的假设检验 212
- 12.2 R分析实例 214
- 12.2.1 率的标准化R程序 214
- 12.2.2 率的Z(U)检验的R程序 215
- 12.3 本章小结 216
- 第13章 行×列表分析 217
- 13.1 四格表资料 217
- 13.1.1 四格表卡方检验介绍 218
- 13.1.2 四格表卡方检验的R程序 220
- 13.2 配对计数资料的卡方检验 224
- 13.2.1 四格表配对卡方检验介绍 224
- 13.2.2 四格表配对卡方检验的R程序 225
- 13.3 列变量为顺序变量的行均分检验 226
- 13.3.1 行均分检验介绍 227
- 13.3.2 行均分检验的R程序 227
- 13.4 行列均为顺序变量的相关检验 230
- 13.4.1 行列均为顺序变量的相关检验介绍 230
- 13.4.2 行列均为顺序变量的相关检验的R程序 231
- 13.5 分层行列表的分析 235
- 13.5.1 分层行列表的分析简介 235
- 13.5.2 分层行列表的分析的R程序 236
- 13.6 趋势卡方检验 239
- 13.6.1 趋势卡方检验简介 239
- 13.6.2 趋势卡方检验的R程序 239
- 13.7 卡方分割与卡方合并 241
- 13.7.1 卡方的分割与合并简介 241
- 13.7.2 卡方分割与卡方合并分析实例 241
- 13.8 本章小结 243
- 第14章 非参数统计 244
- 14.1 单样本资料与已知总体参数的非参数检验 245
- 14.1.1 单组资料的符号及符号秩和检验 245
- 14.1.2 单组资料的非参数检验R程序 247
- 14.2 配对设计资料的非参数检验 248
- 14.2.1 配对设计资料的符号及符号秩和检验 248
- 14.2.2 配对设计资料的非参数检验R程序 249
- 14.3 两组定量资料的非参数检验 250
- 14.3.1 两组定量资料的非参数检验方法概述 251
- 14.3.2 两组定量资料非参数检验的R程序 252
- 14.4 多组定量资料的非参数检验 253
- 14.4.1 多组定量资料的非参数检验方法概述 253
- 14.4.2 多组定量资料非参数检验的R程序 255
- 14.5 等级分组资料的非参数检验 260
- 14.5.1 等级分组资料的非参数检验方法概述 260
- 14.5.2 等级分组资料非参数检验的R程序 261
- 14.6 随机区组资料的非参数检验 264
- 14.6.1 随机区组资料的非参数检验方法概述 264
- 14.6.2 随机区组资料非参数检验的R程序 265
- 14.7 等级相关(秩相关) 266
- 14.7.1 秩相关概述 266
- 14.7.2 spearman秩相关的R程序 267
- 14.8 本章小结 268
- 第15章 生存分析 269
- 15.1 生存分析简介 269
- 15.1.1 生存数据 269
- 15.1.2 生存时间函数 270
- 15.1.3 均数、中位数和半数生存期 271
- 15.1.4 生存分析的基本方法 271
- 15.2 生存曲线 272
- 15.2.1 寿命表法及R分析实例 273
- 15.2.2 乘积极限法(Kaplan-Meier)及R分析实例 278
- 15.2.3 Cox回归及R分析实例 280
- 15.3 本章小结 285
- 第16章 主成分分析 286
- 16.1 主成分分析简介 287
- 16.1.1 主成分分析的数学模型 287
- 16.1.2 主成分分析的方法步骤 288
- 16.1.3 主成分分析的应用 290
- 16.2 R中的主成分分析实例 291
- 16.3 本章小结 307
- 第17章 因子分析 308
- 17.1 因子分析简介 308
- 17.2 主成分分析与因子分析比较 317
- 17.3 因子分析及R实例 318
- 17.4 本章小结 337
- 第18章 聚类分析 338
- 18.1 聚类分析简介 338
- 18.2 聚类分析及R实例 344
- 18.2.1 varclus ()函数 344
- 18.2.2 kmean()函数 348
- 18.2.3 hclust()函数实例 352
- 18.3 本章小结 355
- 第19章 判别分析 356
- 19.1 判别分析简介 357
- 19.2 判别分析及R实例 362
- 19.3 本章小结 386
- 第20章 典型相关分析 388
- 20.1 典型相关简介 388
- 20.1.1 典型相关分析的理论架构及基本假设 390
- 20.1.2 冗余分析 391
- 20.1.3 典型相关系数的假设检验 392
- 20.2 cancor()函数实例 392
- 20.3 本章小结 400
- 第21章 诊断试验的ROC分析 401
- 21.1 诊断试验简介 401
- 21.1.1 诊断试验介绍 401
- 21.1.2 诊断试验评价指标 402
- 21.1.3 ROC分析资料收集与整理 404
- 21.1.4 ROC曲线构建 405
- 21.2 ROC分析及R分析实例 406
- 21.3 本章小结 423
- 第22章 统计图 425
- 22.1 条形图 425
- 22.2 饼图 429
- 22.3 散点图 431
- 22.4 折线图 433
- 22.5 箱线图 434
- 22.6 直方图 437
- 22.7 核密度图 442
- 22.8 点图 442
- 22.9 本章小结 444
- 参考文献 445