容灾备份 数据级容灾案例
某通信运营商数据级容灾案例
发布时间:2016-07-06 案例来源:美创科技
客户情况简介

某通信运营商作为在浙江的分支机构,成立于1995年8月31日,是一家拥有11家地市分公司、64个县市分公司、资产上百亿的特大型国有企业;是一家同时在香港、纽约、上海三地上市、集移动通信(GSM和CDMA)、数据通信、无线寻呼、国际国内长途以及各种电信增值业务为一体的浙江省唯一的综合电信运营企业。作为电信产业改革快速发展的现代企业,该企业目前信息化程度非常高,业务系统非常复杂,包括CRM、PRM、综合账务、综合计费、服务开通、BI经营分析、一卡充、综合结算、乡镇支持、客服等20+套业务系统;其操作系统包括IBM,HP,linux环境等;oracle版本包括9i、10g和11g。其主干业务系统需要提供7X24小时的对外服务。数据的高度集中带来了信息的高风险,一旦业务发生全局性、大规模运营中断,且无法在可控、可预期的时间内将其恢复正常,必然造成巨大的客户和资金损失,另一方面,长时间的业务停顿还会带来严重的社会影响,会给该企业品牌和信誉造成无法估量的损失。

面临的主要问题:

  • 原有的容灾系统采用的硬件存储技术构建的,由于无法满足容灾完备性的要求,在出现电路故障时容灾系统是失效的。
  • 为了提高对地域性灾难的防灾能力,两端系统距离远。生产中心与容灾中心相距约35KM,采用光纤网络进行数据传输。
    当业务系统发生故障时,能够在短时间内恢复,确保业务系统7*24小时连续运行。

美创科技解决方案

在生产系统部署客户端程序,针对应用层的各种文件,提供文件级别的数据同步;针对应用的核心,数据库,提供日志挖掘和传输服务;在容灾系统部署服务端模块,实现多对一的部署,集中容灾;WEB管理端用来实现容灾系统的WEB管理,实现多合一模式下的集中化管理,包括总体监视、切换、容灾操作、作业信息检查、活动站点管理等功能。

  • 数据同步

    利用美创DBRA应用级软件在主备两端实现数据库同步,由于DBRA是以片段的形式传输数据,并且只传输变化的数据,所以容灾数据量小,可以在有限的带宽上实现远距离容灾,确保两端数据的高度一致性和实时性。DBRA在生产系统中仅仅挖掘日志文件,数据分析及数据合成都在容灾系统处理,不占用生产系统资源,不需要对用户现有的服务器、存储、操作系统、数据库做任何改动,并且可以实现容灾系统的在线实施和的在线升级。

  • 容灾切换和运维管理

    在多主机、多存储、多操作系统版本、多数据库版本的复杂业务模式下,为实现集中式应用级容灾这一核心目标,更加需要具备自动化容灾切换和运维管理的应用级容灾软件来实现容灾切换和运维管理,减少灾难发生后,人工参与的过程,避免误操作。

    DBRA支持全业务切换、细粒度切换和一键式灾难恢复,灾难切换非常简单;当发生灾难时可以利用这些功能进行快速的容灾切换和系统接管确保用户业务连续性;另一方面也可以帮助用户建设计划内停机时间,当用户需要进行网络维护、服务器、存储系统维护、甚至机房搬迁时,DBRA容灾系统可以接管用户的业务系统,当维护完成后,DBRA会自动把新增的业务数据同步到生产系统中,并对数据一致性进行校验,当确认两边数据一致后,自动切换到生产系统运行。

方案效果

本方案针对CRM、综合账务、PRM、OCS等多套核心业务系统,实现异地应用级容灾建设。应用级容灾系统建设后,本方案可以确保如若核心业务系统出现问题时,在生产系统和容灾系统之间形成可以相互切换,相互恢复。生产系统出现异常或计划内维护时,生产系统可以简单的切换至容灾系统,容灾系统替代生产系统提供服务;生产系统硬设备复原之后,容灾系统初始化后可以回切至生产系统,并且切换快速、稳定、并且只需通过web界面简单操作即可实现。

应用了美创科技的容灾系统后,面对诸如逻辑腐败,电力故障等各种灾难,都可以进行完善的保护;容灾切换顺利,满足RPO和RTO的要求。同时,为了提高客户容灾系统的价值,我们在容灾端部署了active disaster site组件,使容灾端数据库可以运行在只读状态。可以把一些特定的业务系统(对数据库只读操作)部署到容灾端运行,从而降低生产系统的压力,比如作为数据仓库的数据来源,报表系统的数据源等。

  • 业务级的容灾,DBRA是业界第一个以整个业务系统为视角进行组织和管理的软件技术,能实现一个完整业务系统(包括数据库、中间件、 分布式系统、业务应用、IP地址等)的整体切换,不仅保证数据的容灾,还可以保证整个业务系统的容灾;当发生灾难时,往往会造成的巨大恐慌,DBRA灾难切换可实现一键式容灾WEB切换,避免人工出错和降低RTO使RTO可控。
  • 随时校验数据的有效性,DBRA提供容灾系统数据校验功能,在日常运行不终止容灾同步的前提下,随时校验数据的变化同步状态,让客户在日常管理中,了解容灾系统的可用性,而不是需要容灾切换才能知道容灾系统的可用性。而且容灾系统的数据校验功能,不需要客户提供额外的设备或切换等操作,便能轻松实现。
  • 灾备一体化,DBRA用一套软件可以同时实现容灾和备份的功能,避免了分别建设容灾和备份系统的重复性投资。DBRA的备份是真正的实时备份,备份数据随时可用。避免了传统备份无法解决的备份窗口问题和数据丢失问题。同时备份数据的随时可用,大大减少了业务系统的停机时间,提高容灾系统的利用率。
  • 容灾的完备性,灾难是多种多样的,如:地震、火灾、电力故障、人为误删除、病毒、黑客入侵等等。灾难一般可以分为物理错误和逻辑错误。DBRA对于物理错误和逻辑错误都能进行很好的防范,尤其在发生电力故障、电源故障等情形下导致的逻辑故障,具有良好的解决能力。
  • 人为错误的保护,DBRA对于发生频率比较高的误操作也可以很好的防范。数据库里具有危险性的操作(DROP),DBRA可以进行阻断,同时对于已经发生的误操作,DBRA可以做到基于数据库、表空间、表格等细粒度的闪回,帮助用户快速的找回误删除的数据。
  • 投资保护,容灾网络是容灾系统的主要投资点。DBRA对于容灾网络的带宽和网络质量要求不高,尤其对于长距离容灾,优势明显。可以保证支持比较恶劣的网络环境(如:长时间的中断或是频繁的段中断的网络环境)。所以DBRA容灾系统需要的带宽投资相对较省。
  • 容灾数据可查询,负载分担DBRA容灾端的数据库提供查询的功能,使客户的部分业务可以迁移到容灾端进行,起负载分担功能,减少生产端的压力。同步容灾端的数据查询对容灾数据不做任何修改,保证容灾数据的正确性。