新闻中心

当前页面: 首页 >新闻中心 >新品速递 >工业云计算平台的高可用性设计

工业云计算平台的高可用性设计

供稿:中国工控网 2015/12/22 23:58:28
5 人气:--

    海得控制推出的工业云计算平台(代号为indusCloud)方案是以国际主流基础架构即服务(IaaS)技术为标准,以最具影响力的数据中心云计算软件Openstack开放源代码为核心,基于它提供的计算资源管理、存储管理、网络管理、镜像管理、认证管理、计量管理和其他模块进行一定的二次开发和功能优化而形成的。indusCloud兼容异构虚拟化软件、服务器设备、存储设备和网络设备,同时结合存储计算融合的架构,基于分布式存储,构建一个符合主流技术的、易于扩展的、高可用的、具备国产自主可控的云计算虚拟化软件方案。

        indusCloud工业云计算平台的高可用的设计要点包含云计算管理平台高可用、计算节点高可用、存储系统的高可用和网络系统的高可用等,最终实现工业IT系统及应用的高可用性。

    云计算管理平台采用硬件级容错服务器设计,采用芯片级同步处理技术(Lock-Step)确保任何故障(甚至于瞬时故障)都能被准确检测到,包括 CPU、内存,主板、磁盘、网络及电源在内的任何故障发生,系统零秒中断,无任何数据丢失。从而保障云计算管理平台永远持续在线运行,系统可靠性99.9998%以上。内置AutomatedUptime Layer系统软件,用于检测潜在问题,并预防中断。持续监控500 多个系统组件和传感器状态,从而在故障对系统造成影响之前对其进行识别、处理和报告。提供单一系统管理视图,并结合广泛的状态 LED 指示灯,从而消除管理复杂性。

  

    云计算管理平台可以根据负载进行智能分析调度,实现统一资源池中节点负载均衡,更好的利用资源。无论是计算还是存储系统,在发生故障的时候可以自动快速恢复。这种分布式计算系统和存储系统设计,很容易扩展,新节点只需要简单配置,便能自动开始承载负荷,实现资源池的横向扩展。

    对于数据中心大多数应用系统,通过虚拟机HA热迁移高可用性技术,可以避免因计划内停机而导致业务中断。通过监控主机IPMI数据,在物理机出现故障预警时动态迁移该节点上的虚拟机至健康的主机节点上。即使是计划外停机(如物理机突然奔溃),运行在上面的虚拟机迁移恢复时间也可以控制在几分钟以内,保障业务连续运行。

    然而对于重量级的核心数据库系统,关键应用管理系统。需要更高可靠性的系统设计方案,完全可以避免因计划外宕机而导致的业务中断。其中最具有代表性的是海得公司推出的H&I SERVER冗余容错服务器方案。主要特征是,基于硬件虚拟化设计,采用虚拟内存同步技术和IO多路径热转移技术,实现客户虚拟机系统在冗余的物理机节点间双活同步运行,包括芯片、内存、主板、电源在内的任何物理节点故障发生,虚拟机系统连续不中断运行。可靠性定义在99.999%以上。

 

        indusCloud通过底层分布式存储技术,将x86服务器节点组成一个高可用的分布式存储资源池。indusCloud上层将存储资源池化成云硬盘(块存储),为用户提供云硬盘管理服务。分布式存储可以实现文件的多副本保存,同一份数据在多个物理节点分散存储,单物理节点上的硬盘也通过硬件RAID做磁盘级别的防护,避免单点失效,同时分布式存储拥有智能恢复和均衡技术,在遇到故障时能够实现自动容错和负载协同。

    集中式存储(共享磁盘阵列)采用双活控制器容错设计,Mirror-Cache高速缓存镜像技术,实现故障零秒切换功能。全冗余及模块化设计,无单点故障。所有部件如电源、风扇、控制器和硬盘均支持在线不停机更换。99.999%以上可靠性。

    网络层面的高可用主要保证所有连接冗余,每个服务器配备双物理卡网络层面的高可用主要保证所有连接冗余,交换机和防火墙也配备了双活冗余(如链路聚合,VRRP等),避免因单点失效而导致的网络中断。

更多内容请访问 中国工控网(http://www.gongkong.com)

手机扫描二维码分享本页

工控网APP下载安装

 

我来评价

评价:
一般