系统管理

致云云管理平台针对公有云和私有云场景,提供多种系统管理手段,本章节主要讲解系统架构管理和状态监控原理,其他功能点和细节请参看具体产品手册。

系统架构

致云云管理平台提供两个层面的架构管理和监控,一个层面是逻辑架构,包含工作域、服务组、服务组件的架构和运行状态监控,另一个层面是物理架构,包含机房、机架、服务器的架构管理和状态监控,用户可以预先根据自己的物理架构进行配置,当系统出现故障时,告警信息会携带好关联的服务器信息,以便更快地进行故障定位和排查。

_images/15_system_structure.png

状态监控

致云云管理平台内置了从虚拟资源到物理资源一整套状态监控方案,最大程度满足公有云或者私有云用户对平台资源管理和监控的需要,并为动态均衡、高可用、故障恢复等高级特性提供了跟可靠的支撑。

采集数据包含但不限于:

  • 每个云主机的每个vCPU计算时间、内存、磁盘IO、网络带宽用量
  • 每个物理资源节点的物理CPU、内存、磁盘IO、网络带宽用量
  • 每个云主机、资源节点、组件的运行信息、活动状态
  • 每个计算资源池的资源容量及使用情况
  • 整个云平台的资源容量及使用情况

系统会持续实时采集并计算云平台的资源用量和运行状况,一方面为管理员提供实时系统监控信息,另一方面也为内部动态资源均衡调度提供支持,而且还能生成服务用量详单和统计报表,为优化资源使用和服务计费提供原始数据。

主要工作流程如下图所示:

_images/16_status_observe.png

数据来源主要来自计算资源池内各计算资源节点,计算资源节点会实时采集本节点的云主机、宿主机资源用量和运行状况,持续通知主控节点,主控节点会动态更新到内部监控系统中。

前端管理界面通过Restful API从主控节点查询监控信息,实时呈现给管理员。另一方面,统计服务器从主控节点采集监控信息,并持续生成服务详单和统计报表。