본문 바로가기
IT운영/재해복구

[재해복구시스템 운영] BCP(업무 연속성 계획) & BIA(업무 영향 분석)

by Torobeen 2023. 4. 3.
반응형

타이틀

 

1. BCP란

기업 비즈니스 중에는 지진, 홍수와 같은 천재지변이나 화재와 같은 재해가 발생할 수 있다. BCP(Business Continuity Planning)는 이러한 상황에서 시스템 복구와 데이터 복원 등으로 IT 자원의 연속성을 보장하는 체계를 말한다. 쉽게 말해 업무의 연속성을 계획하는 것이다.

 

(1) BGP 구현 절차

BCP를 구현하는 데는 6단계 절차가 있다.

 

1) 현황분석

BCP에 착수하는 단계이다. 이 단계에서는 기업 현황 분석을 진행한다.

 

2) 위험분석

기업에서 발생할 수 있는 위험을 정립하고 업무의 특성 별로 위험 요인을 파악한다.

 

3) BIA

핵심업무와 IT 자원을 식별하고 영향 및 MTD(Maximum Tolerable Downtime, 최대로 허용되는 다운타임 시간)를 파악한다. 서비스 우선 순위와 복구 목표 시간을 결정한다. (RSO, RPO, RTO, RCO 등)

 

4) 전략수립

백업 센터 구축 전략을 세우고 비즈니스 연속성 전략을 수립한다. 위험 및 영향을 분석한 기업의 정보동향 자료를 바탕으로 재해 시 대응방안 및 운영방안을 마련한다.

 

5) 방안수립

DR센터와 백업에 대한 방안을 수립하는데, 이 때 복구 목표 시간이나 운영 형태(독립, 상호 이용, 공동) 또는 기술형태(미러, Hot, Warm, Cold)에 따라 구체적인 방안을 세운다.

 

6) 모의훈련

수립한 방안에 기반한 재해 대응 훈련 및 교육을 진행하고, 지금껏 수립했던 방안이나 정의서, DR센터 구축 데이터 등을 문서화한다. 최종 검토 및 승인이 완료되면 BCP 프로젝트를 마무리하면 된다.

 

 

2. BIA란

BIA(Business Impact Analysis)는 시스템의 장애나 재해로 인해 시스템의 연속성에 영향이 갔다고 가정하고, 시간 흐름에 따른 업무 영향도나 손실을 평가하는 것이다. BIA는 BCP를 구축하기 위한 핵심 절차이다.

 

(1) 목적

우선 우선순위를 결정하여 한다. 모든 프로세스에 중요, 보통, 미미, 무영향 등의 4가지로 우선순위를 부여한다.

 

1) 중요(Mission Critical)

- 동일 수준의 자원 성능으로 대체되지 않는 한 수행될 수 없는 중요 프로세스
- 수작업으로 대체가 불가
- 시스템 중지 시 손실비용이 가장 높음
- RTO 0~2시간 내

 

2) 보통 (Critical)

- 일시적인 수작업이 가능
- RTO 2~8시간 내

 

3) 미미 (Administrative)

- 긴 시간 동안 중단될 수 있지만 어느정도 감수할 수 있는 비용을 유발
- 수작업으로 대체 가능
- RTO 1~5일 내

 

4) 무영향 (Non-Critical)

- 긴 시간 동안 중단될 수 있고 기업에 거의 비용을 발생시키지 않음
- RTO 7~14일 내

 

기업을 유지하기 위해 최대 복구 가능한 중단 시간을 산정하고, 핵심이 되는 프로세스나 민감한 서비스에 할당되어야 하는 자원의 요구사항을 분석한다.

 

(2) 주요 조사 사항

복구 목표 시간과 소요 자원을 산정한다.

 

선/후행 업무나 관련 응용 프로그램 등의 상호 의존도와, 대외 기관 또는 대외 신뢰도에 미치는 영향을 조사하여 재무적이나 운영적인 영향도를 조사한다. 운영 측면이나 재무 측면에서 충격 요인을 분석한다.

현행 인원수, 최소 필요 인력, 인력 백업 대책 등의 인력 관리와, 최소 필요 자원, 자원 백업 대책 등의 자원 관리를 문서화하고 관리한다.

 

(3) 도출 항목

1) RSO (Recovery Scope Objective)

- 복구 대상
- 예시 : 인사시스템, 정보시스템, 대외시스템

 

2) RPO (Recovery Poing Objective)

- 복구 시점
- 예시 : 특정 백업 시점, 전일 마감 시점, 재해 발생 시점

 

3) RTO (Recovery Time Objective)

- 업무 재개를 위해 필요한 시간
- 예시 : 즉시, 2시간 이내, 24시간 이내

 

4) RCO (Recovery Communication Objective)

- 네트워크 복구 목표
- 예시 : 지점, 주요 영업점, 모든 영업점

 

5) BCO (Backup Center Objective)

- 백업 센터 구축 목표

 

6) MTD (Maximum Tolerance Downtime)

- 허용 가능한 다운타임

 

7) MBCO (Minimum Business Continuity Objective)

- 최소 업무 연속성 목표

 

8) MTPD (Maximum Tolerance Period Disruption)

- 최대로 허용하는 중단 시간

반응형