本书《OpenStack系统架构设计实战》对各主流云管理平台进行了全面介绍和对比,但重点放在了OpenStack平台上。它提供了丰富的实战案例和项目经验,可为读者提供深入学习和应用OpenStack的指导。该书对OpenStack的系统架构设计进行了详细解析,包括各个组件的功能、原理和使用方法。读者通过学习该书,可以全面了解OpenStack平台的运作原理和架构设计,从而能够灵活应用OpenStack来构建和管理云环境。如果你对OpenStack感兴趣,想要学习和掌握它,这本书值得一读。
OpenStack系统架构设计实战电子书封面
读者评价
与《云计算基础架构及关键应用》相比,针对openstack 做了相对详细的介绍,相比硬啃,建议和实际工作有关联的地方做对应阅读,理解会深刻些。
openstack入门读物,对os主要模块做了介绍
几个常用组件的产品简介
内容介绍
本书对各主流云管理平台进行介绍及对比后,主要对OpenStack平台进行重点介绍。包括OpenStack项目的存储管理(Cinder)模块、Neutron架构及具体功能、Ceilometer的架构及关键组件、Openstack中编排子系统(Heat)的相关概念/架构及其实现、Ironic的架构/运行原理,最后阐述云计算带来的包括虚拟化安全、数据安全、身份和访问管理安全等新的安全挑战。
目录
- 序
- 前言
- 第1章 云管理平台概述
- 第2章 计算管理(Nova)
- 第3章 存储管理(Cinder)
- 第4章 网络管理模块(Neutron)
- 第5章 计量与监控(Ceilometer)
- 第6章 编排(Heat)
- 第7章 裸机管理(Ironic)
- 第8章 消息总线
- 第9章 OpenStack大数据服务(Sahara)
- 第10章 OpenStack数据库服务(Trove)
- 第11章 OpenStack安全方案
- 第12章 OpenStack孵化项目简介
- 参考文
OpenStack云环境高可用(HA) 云环境是一个广泛的系统,包括了基础设施层、OpenStack云平台服务层、虚拟机和最终用户应用层。 云环境的 HA 包括: • 用户应用的 HA • 虚拟机的 HA • OpenStack云平台服务的 HA • 基础设施层的HA:电力、空调和防火设施、网络设备(如交换机、路由器)、服务器设备和存储设备等
服务的分类 HA 将服务分为两类: • 有状态服务:后续对服务的请求依赖于之前对服务的请求。OpenStack中有状态的服务包括MySQL数据库和AMQP消息队列。对于有状态类服务的HA,如neutron-l3-agent、neutron-metadata-agent、nova-compute、cinder-volume等服务,最简便的方法就是多节点部署。比如某一节点上的nova-compute服务挂了,也并不会影响到整个云平台不能创建虚拟机,或者所在节点的虚拟机无法使用(比如ssh等)。 • 无状态服务:对服务的请求之间没有依赖关系,是完全独立的,基于冗余实例和负载均衡实现HA。OpenStack中无状态的服务包括nova-api、nova-conductor、glance-api、keystone-api、neutron-api、nova-scheduler等。由于API服务,属于无状态类服务,天然支持Active/Active HA模式。因此,一般使用 keepalived +HAProxy方案来做。 HA 的种类 HA 需要使用冗余的服务器组成集群来运行负载,包括应用和服务。这种冗余性也可以将 HA 分为两类: • Active/Passive HA:即主备HA。在这种配置下,系统采用主和备用机器来提供服务,系统只在主设备上提供服务。在主设备故障时,备设备上的服务被启动来替代主设备提供的服务。典型地,可以采用 CRM 软件比如 Pacemaker 来控制主备设备之间的切换,并提供一个虚拟 IP 来提供服务。 • Active/Active HA:即主主HA,包括多节点时成为多主(Multi-master)。在这种配置下,系统在集群内所有服务器上运行同样的负载。以数据库为例,对一个实例的更新,会被同步到所有实例上。这种配置下往往采用负载均衡软件比如 HAProxy 来提供服务的虚拟 IP。
OpenStack云平台层 云平台高可用(HA) 高可用(HA)介绍 高可用性是指提供在本地系统单个组件故障情况下,能继续访问应用的能力,无论这个故障是业务流程、物理设施、IT软/硬件的故障。最好的可用性, 就是你的一台机器宕机了,但是使用你的服务的用户完全感觉不到。你的机器宕机了,在该机器上运行的服务肯定得做故障切换(failover),切换有两个维度的成本:RTO (Recovery Time Objective)和 RPO(Recovery Point Objective)。RTO 是服务恢复的时间,最佳的情况是 0,这意味着服务立即恢复;最坏是无穷大意味着服务永远恢复不了;RPO 是切换时向前恢复的数据的时间长度,0 意味着使用同步的数据,大于 0 意味着有数据丢失,比如 ” RPO = 1 天“ 意味着恢复时使用一天前的数据,那么一天之内的数据就丢失了。因此,恢复的最佳结果是 RTO = RPO = 0,但是这个太理想,或者要实现的话成本太高。 对 HA 来说,往往使用分布式存储,这样的话,RPO =0 ;同时使用 Active/Active (双活集群) HA 模式来使得 RTO 几乎为0,如果使用 Active/Passive HA模式的话,则需要将 RTO 减少到最小限度。HA 的计算公式是[ 1 - (宕机时间)/(宕机时间 + 运行时间)],我们常常用几个 9 表示可用性: • 2 个9:99% = 1% 365 = 3.65 24 小时/年 = 87.6 小时/年的宕机时间 • 4 个9: 99.99% = 0.01% 365 24 * 60 = 52.56 分钟/年 • 5 个9:99.999% = 0.001% * 365 = 5.265 分钟/年的宕机时间,也就意味着每次停机时间在一到两分钟。 • 11 个 9:几年宕机几分钟。