《Oracle RAC核心技术详解》共包含13章,一部分:第1章~第9章,包含了对集群管理软件的详细介绍,读者可以在这部分找到关于11gGI和10gCRS核心技术的详细介绍,以及集群的核心组件CSS、CRS和11gR2新增的OHAS组件与守护进程,同时还讲解了诊断集群问题常用的诊断工具。最后,由于从11gR2版本开始ASM已经变成了集群管理软件的一个组件,作者在这部分内容中还介绍了和集群、数据库相关的ASM知识。第二部分:第10章~第13章,包含了RAC数据库的核心技术——内存融合,作者用大量的篇幅介绍内存融合技术的核心组件以及工作原理,并且还对RAC相关的性能调优知识进行了的介绍。最后,作者还讲解了RAC中的连接管理和工作负载管理知识。
目录
- 序言一
- 序言二
- 前言
- 第一部分集群管理软件
- 第1章 Oracle 集群技术介绍2
- 1.1 集群技术简介2
- 1.1.1 高可用集群2
- 1.1.2 负载均衡集群3
- 1.1.3高性能计算集群3
- 1.1.4 share-nothing结构4
- 1.1.5 share-everything结构4
- 1.2 Oracle集群技术简介5
- 1.2.1 Oracle RAC 历史5
- 1.2.2 小结9
- 总结10
- 第2章 安装Oracle 集群11
- 2.1 安装集群管理软件11
- 2.1.1 安装前准备11
- 2.1.2 安装软件12
- 2.1.3 配置集群13
- 2.2 安装集群管理软件中的重要部分13
- 2.2.1 角色任务分离14
- 2.2.2 中央目录15
- 2.2.3 cluvfy 工具17
- 2.2.4 root.sh 脚本20
- 总结29
- 第3章 11gR2 集群新增组件30
- 3.1 OHAS31
- 3.1.1 集群启动方式31
- 3.1.2 资源管理方式39
- 3.1.3 ohasd 管理的资源47
- 3.2 案例分析55
- 3.2.1 由于丢失OLR 导致的节点无法启动55法启动56
- 总结58
- 第4章 11gR2 集群新增的集群守护进程59
- 4.1 mdns 59
- 4.1.1 mdnsd.log60
- 4.1.2 gpnpd.log61
- 4.1.3 ohasd.log62
- 4.2 gpnp63
- 4.2.1 gpnp wallet63
- 4.2.2gpnp profile63
- 4.2.3 gpnpd 守护进程65
- 4.2.4 gpnpd.log 实例66
- 4.3 gipc68
- 4.3.1 gipc 的概念和功能68
- 4.3.2 gipcd.log 实例69
- 4.4 DiskMON73
- 4.5 CTSS73
- 4.6 cssdagent 和 cssdmonitor77
- 4.7 案例分析78
- 4.7.1 由于同一个子网中存在同名集群导致的gpnp 无法启动78
- 4.7.2 由gipc进程导致的节点无法启动81
- 总结87
- 第5章 CSS部分88
- 5.1 CSS 组件的启动顺序88
- 5.1.1 ocssd 启动顺序88
- 5.1.2 cssd 启动日志分析89
- 5.2 集群心跳机制98
- 5.2.1 网络心跳98
- 5.2.2 磁盘心跳100
- 5.2.3 本地心跳102
- 5.2.4 集群重新配置场景104
- 5.2.5 术语和参数简介111
- 5.3 CSS组管理113
- 5.3.1 ASM 实例关闭114
- 5.3.2 ASM 磁盘组被卸载118
- 5.4 11g CSS新特性120
- 5.4.1 成员终止升级120
- 5.4.2 Rebootless Restart124
- 5.5 案例分析127
- 5.5.1 AIX 平台上著名的bug 13940331 导致的节点重启问题127
- 5.5.2 典型的由于丢失网络心跳导致的集群脑裂134
- 5.5.3 由于OS 性能问题导致的oprocd 进程重启节点138
- 5.5.4 由于OS 层面的套接字参数设置导致的ORA-29701 错误141
- 总结145
- 第6章 CRS 部分146
- 6.1 CRSD 功能介绍146
- 6.1.1 10gR2 版本146
- 6.1.2 11gR2版本172
- 6.2 案例分析192
- 6.2.1 由于CVU导致的VIP 无法漂移192
- 6.2.2 由于著名的bug10058182导致的CRSD挂起195
- 6.2.3 由于CRSD工作方式导致的数据库实例无法被关闭197
- 总结203
- 第7章 Oracle集群管理软件的启动顺序204
- 7.1 OHAS 层面205
- 7.2 CSS层面210
- 7.3 CRSD层面216
- 7.4 GI的关闭顺序223
- 7.5 集群的套接字文件和网络验证224
- 7.5.1 套接字文件225
- 7.5.2 网络验证226
- 7.5.3 常用的网络检查命令和输出226
- 总结230
- 第8章 集群诊断工具概述231
- 8.1 diagcollection.pl231
- 8.1.1 10gR2和11gR1 版本231
- 8.1.2 11gR2版本232
- 8.2 orachk233
- 8.2.1 简介233
- 8.2.2 安装并运行234
- 8.2.3 升级检查236
- 8.2.4 检查报告237
- 8.3 TFA239
- 8.3.1 简介239
- 8.3.2 安装和使用239
- 8.3.3 手动运行TFA242
- 8.4 OSWbb242
- 8.4.1 安装和卸载OSWbb243
- 8.4.2 配置、运行和停止OSWbb243
- 8.4.3 OSWbb搜集的信息244
- 总结246
- 第9章 ASM基础247
- 9.1 ASM的功能和架构248
- 9.1.1 ASM功能248
- 9.1.2 磁盘组248
- 9.2 ASM实例254
- 9.2.1 初始化参数文件254
- 9.2.2 内存结构255
- 9.2.3 后台进程256
- 9.2.4 ASM实例启动顺序256
- 9.3 数据库和ASM实例通信258
- 9.3.1 基本概念258
- 9.3.2 后台进程259
- 9.3.3 基本操作261
- 9.4 OCR/VF和ASM磁盘组261
- 9.4.1 存放方式262
- 9.4.2 Quorum disk264
- 9.5 案例分析265
- 总结270
- 第二部分 RAC数据库软件
- 第10章 解析内存融合技术272
- 10.1 RAC和单实例数据库的区别272
- 10.1.1 内存结构273
- 10.1.2 后台进程274
- 10.1.3 物理数据库275
- 10.1.4 小结278
- 10.2 内存融合概念278
- 10.2.1 全局资源目录278
- 10.2.2 资源和锁280
- 10.2.3 主节点284
- 10.2.4 消息机制286
- 10.3 内存融合的过程289
- 10.3.1 非PCM资源的访问过程289
- 10.3.2 PCM资源的访问过程294
- 10.4 SCN的传播与log file sync310
- 10.4.1 SCN的传播方式310
- 10.4.2 log file sync 等待事件316
- 10.5 DRM和read mostly317
- 10.5.1 DRM的基本概念317
- 10.5.2 DRM过程319
- 10.5.3 DRM 过程示例320
- 10.5.4 read mostly325
- 10.6 案例分析326
- 10.6.1 DRM性能问题导致的数据库实例崩溃326
- 10.6.2 内存问题导致的数据库实例崩溃329
- 总结332
- 第11章 RAC 数据库的实例管理333
- 11.1 节点管理333
- 11.1.1 基本概念333
- 11.1.2 节点列表334
- 11.1.3 实例启动和关闭334
- 11.2 CGS340
- 11.2.1 实例之间的心跳机制340
- 11.2.2 数据库的重新配置343
- 11.2.3 重新配置的类型348
- 11.2.4 数据库层面的脑裂349
- 11.3 实例恢复349
- 11.3.1 阶段1350
- 11.3.2 阶段2352
- 11.3.3 阶段3353
- 11.3.4 lazy remaster353
- 11.3.5 实例恢复示例353
- 11.4 LMHB354
- 11.4.1 LMHB 工作机制354
- 11.4.2 LMHB终止实例示例355
- 11.5 案例分析360
- 总结361
- 第12章 RAC 性能调优362
- 12.1 基本概念362
- 12.1.1 RAC相关的统计信息362
- 12.1.2 AWR报告中RAC相关的信息364
- 12.1.3 RAC 相关的等待事件374
- 12.2 RAC数据库的常见性能问题382
- 12.2.1 序列导致的性能问题382
- 12.2.2 索引块争用导致的性能问题388
- 12.2.3 过多物理读导致的性能问题392
- 12.2.4 缓存尺寸导致的性能问题395
- 12.3 11gR2新特性之HM399
- 12.3.1 基本概念399
- 12.3.2 HM工作方式399
- 12.3.3 示例日志输出403
- 12.4 案例分析406
- 12.4.1 由于存储问题导致的数据库性能下降406
- 12.4.2 由于连接风暴导致的数据库性能问题409
- 总结414
- 第13章 RAC中的连接管理和工作负载管理415
- 13.1 数据库连接的基础知识415
- 13.1.1 连接建立的过程415
- 13.1.2 配置文件416
- 13.1.3 数据库参数418
- 13.1.4 RAC数据库的连接420
- 13.2 负载均衡430
- 13.2.1 客户端负载均衡430
- 13.2.2 服务器端负载均衡431
- 13.3 连接的故障切换436
- 13.3.1 连接时故障切换436
- 13.3.2 已存在连接的故障切换437
- 总结441
- 附录A 11gR2 集群安装指南442
- 附录B 11gR2 集群升级指南475