当前位置:首页>>杂志 > 金融电子化 > 【2017年1月刊】 >

"2016金融信息化10件大事"——中国工商银行完成核心信息系统同城接管运行

“同城切换正式开始!”2016年11月5日上午9时25分,随着中国人民银行副行长范一飞的一声指令,工商银行核心信息系统由上海外高桥园区切换至嘉定园区,耗时仅2分钟左右。系统在嘉定园区平稳运行1小时12分后,10时39分,范一飞副行长发布回切指令,系统成功回切至外高桥园区。在跨越55公里的自动接管运行期间,工商银行全集团、境内外各项业务正常开展,交易响应情况及系统运行性能良好。

“双活”:从灾难备份到业务连续性的质变
 
作为全球化经营的大型商业银行,工行上海数据中心为遍布五大洲40多个国家和地区的分支机构提供IT服务,并于2003年完成国内领先的核心系统异地灾备体系建设。

新时代的变革呼之欲出。工行在2009年率先于国内同业提出“两地三中心”建设构想,要求数据中心在功能定位、资源使用、故障恢复时间、数据丢失时间等核心指标上有质的飞跃。 

2009年,“两地三中心”工程建设正式启动。项目启动时,国内同业相关工作尚未起步。国外解决方案仅应用于规模较小的系统且成熟度不高,无法满足工行的高标准需求。权衡利弊,工行决定用5年时间,依靠自身科技力量闯出一条自主研发和工程实施的新路。

经过两年的广泛调研和技术研究,2011年8月,工行确定了技术路线和实施方案,并于2012年完成了关键技术和方案原型的测试验证。

2012年10月,原型系统在生产环境成功投产。利用此原型系统,工行可在应用版本投产期间对外提供基本金融服务,显著缩短了版本投产的停机时间。此举亦标志着工行“两地三中心”工程正式进入实施阶段。

随后,工程建设相继取得一系列里程碑式的成果:2013年10月,利用生产中心双园区模拟未来同城双中心,完成核心主机系统和高等级开放平台系统的“双活”部署;2013年11月,成功实施双园区核心主机业务分钟级切换,运行24小时后成功回切。

伴随技术探索的步伐,同城中心基础设施建设也在同步升级。2011年,工行完成同城中心的选址与建设方案论证。2012年,同城中心破土动工。2014年,同城中心园区和机房基础设施竣工并正式启用,核心信息系统在同城双中心间全面实现分钟级切换、回切及“双活”部署,标志着“两地三中心”工程基本建成。

自2014年6月“两地三中心”工程建成以来,工商银行开展了多次持续时间从24小时到3个月不等的全行信息系统同城中心接管运行。做到了对业务全透明、对客户无影响。

3大技术攻关、18项技术创新、13项国家专利申请成就2分钟切换能力

“两地三中心”架构建成后,可在计划内与计划外的场景下为工行业务连续性运作提供更加高效的保障。具体表现在,一是每年计划内应用版本投产的停止对外服务时间由原来的每年约12小时缩短为每年2小时;二是涉及到基础设置的重大调整,可以通过园区切换接管来完成,避免调整对业务可能造成的影响,降低实施风险;三是一旦发生计划外的灾难及故障情况,可以快速实施同城切换,全球业务连续性运作不受影响。

成绩的背后蕴含着工行科技团队对银行科技的深度理解和恰当应用。在工程推进过程中,工行整合科技团队,立足自主创新,在确保数据实时同步、联机及批量负载敏捷调度、全自动智能化感应处置等方面开展攻关,取得一系列技术突破。

一是对数据复制进行端到端、全流程的抽丝剥茧。定位了9大技术难题并逐一攻关,实现高效多路并行数据复制。综合运用数据库复制、磁盘复制、网关日志截留、应用数据回补等技术,确保核心主机在超高联机交易率及批量负载下实现7×24小时不间断复制数据且确保零数据丢失。针对关键开放平台系统,创造性地将数据库异步复制和磁盘同步复制结合,实现同城数据复制的零数据丢失。
二是对目标负载调度进行分类分层。针对性改造不同负载,完成总体负载调度目标:在没有数据丢失前提下,可以将主机联机交易在2分钟左右切换到另一中心运行;根据服务等级要求,高等级开放平台应用可实现几分钟至30分钟内完成中心间切换并提供对外服务。为此,工行自主研发了一套完备的联机安全切换调度流程和工具,实现了集中化联机交易自动调度和统一控制各类联机交易负载。打造了基于磁盘挂接和一体化批量系统调度的切换方案和工具,达成了开放平台应用“异地多活”和“同城双活”两种模式,完成了大量开放平台交易负载在多站点之间的灵活调度。三是自主设计和研发了一套全链路、一键式自动化调度切换平台。将各环节和系统上的数百步操作归集封装,实现了一键式自动化执行调度。同时,投产运维自动化工具平台,统一视图展示“两地三中心”运行状态,实现了三中心的统一监控和统一处理。特别是针对众多开放平台应用系统,实现了数据库单体切换、应用系统整体切换、多个应用并行切换等多种方式。此外,针对同城双活架构的关键部件,首创了一套高可用的保障方案和工具,实现了智能化的“异常主动探查+自动恢复”策略,并在生产环境中落地部署,实现对系统运行状态的自动检测和故障时的自动恢复。

“两地三中心”工程总计开展了38大项技术和方案研究工作,涉及108项应用改造子任务,开展了210轮测试验证工作,解决各类产品技术问题近500项,投入人力3万多人天。同时,技术创新成果显著,共计取得18项技术创新,提交了13项国家专利申请。
 
 

  分享到:
360网站安全检测平台