본문 바로가기
IT운영/재해복구

[재해복구시스템 운영] 가용성 구현 절차 (4) 연속성 구현

by Torobeen 2023. 4. 6.
반응형

타이틀

(1) 가용성 요구 분석

[재해복구시스템 운영] 가용성 구현 절차 (1) 요구 분석

 

(2) 가용성 계획 수립

[재해복구시스템 운영] 가용성 구현 절차 (2) 계획 수립

 

(3) IT 서비스 현황 분석

[재해복구시스템 운영] 가용성 구현 절차 (3) 현황 분석

 

(4) 연속성 구현 전략

1) IT 서비스 연속성 전략 수립

IT 서비스는 위기 관리를 위한 BCP 체계 구조 하에서 대상을 정의하고 관리 프로세스를 설계한다.

IT 서비스와 비즈니스 간 연관 관계, 서비스 중단에 따른 Risk 등 업무 연속성 계획(GCP)을 반영한 전략을 수립하고, 전략에 따른 연간 연속성 관리 계획을 작성한다. 이 계획에는 대상 범위와 관련 담당 조직 정의, 그리고 관련 담당자들의 의견을 기반으로 한 비즈니스 영향 및 위험 분석, 이에 따른 전략 등의 내용이 있어야 한다.

이 전략의 결론은 일반적으로 장비 이중화 또는 DR 센터 구축이다. H/W Fault로 인한 물리적 장애, S/W 비정상 동작으로 인한 서비스 장애, 지진 및 홍수 등의 자연 재해로 인한 데이터센터(IDC) 장애에 대비한 연속성 전략은 결국은 고가용성 구현, 즉 이중화다.

 

2) IT 서비스 연속성 구현 및 관리 (DR 구축 계획 수립)

데이터 손상 예방 및 장애 시 복구 시간 단축을 위해 이중화 환경을 보완한다. 또한 재해 대응을 위한 재해복구(DR) 센터를 구축하여 비즈니스 연속성을 확보한다. DR 센터 구축의 내용에는 이중화 설계, H/W 입고 및 설치, 시스템 구축, 단위 테스트, 통합테스트 및 모의 훈련 등이 있다.

 

재해 선포 이후 DR 센터 서비스 가동까지의 프로세스는 다음과 같다.

 

- 재해 발생 > 재해 선포 > DR 센터 가동 > 주 센터 복귀 및 DR 센터 유지 결정 > 서비스 중지 > 주 센터 시스템 가동

 

3) 연속성 관리 활동

I. 경감 활동

평상시 진행하는 점검을 통해 재난 발생을 예방하거나 발생 범위를 줄이는 활동이다. 현장 점검과 결과를 체계적으로 분석하고 관리하는 것, 그리고 현재 상황을 실시간으로 인지하는 것도 중요하기 때문에 요즘은 기업 내 메신저 뿐만 아니라 스마트폰과 같은 개인 정보기기도 많이 활용하는 추세다.

 

II. 모의 훈련

테스트 계획을 기반으로 시뮬레이션하는 것을 말한다. 보통은 기업 정책에 따라 주기적으로 실시하여, 계획 시나리오를 점검하고 담당자별 대응 역량을 향상시킨다. 모의 훈련 시 운영자가 숙지해야 하는 기준의 종류는 다음과 같다.

- DR 센터 위치
- DR 전환 대상 시스템
- 실행 주기 : 최소 연 N회 실시
- 실행 시기 : 훈련 인원의 집중력 향상을 위해 업무 집중 기간인 월말/월초는 피해서 실시
- 평가 및 결과 정리 : 모의 훈련 중 발생하는 이슈사항은 즉시 수정 조치하여 차기 모의 훈련 때는 재발하지 않도록 하는 것이 목적
- 목표 복구 시간(RTO) : 재해 선포 이후 N시간 이내
- 목표 복구 시점(RPO) : 재해 시점으로부터 N분전 데이터를 복구


III. 재난 대응 준비

실제 재난이 발생했을 때 대응하는 것으로, 담당자들은 상황에 따른 각자의 역할을 신속하고 정확하게 수행하는 것을 목적으로 한다. 담당자들은 재난 발생 시 당황하지 않고 계획된 업무 절차를 처리할 수 있어야 하고, 상황에 따른 업무 절차를 제공해야 하고, 업무 절차 진행 현황이나 재난 상황을 상황실을 통해 실시간으로 확인하고 적절한 의사 결정을 내릴 수 있어야 한다.

 

4) 연속성 관리 활동의 평가 및 의의

연속성 관리 활동은 결국 현 상황에서의 개선사항을 찾아내고, 감사나 경영진 등의 평가를 통해 최종적으로 개선이 이루어져야 한다. 이를 위해서는 모의 훈련 결과나 재난 대응 평가에 대한 객관적인 평가 기준이 필요하다.

반응형