본문 바로가기
IT운영/재해복구

[재해복구시스템 운영] 가용성 구현 절차 (2) 계획 수립

by Torobeen 2023. 4. 5.
반응형

(1) 가용성 요구 분석

[재해복구시스템 운영] 가용성 구현 절차 (1) 요구 분석

 

(2) 가용성 계획 수립

1) 연간 가용성 목표 설정

시스템별, 서비스별로 연간 가용성 목표를 정의한다. 이때 가용성의 수치에 영향이 갈 수 있는 시스템 유지보수나 보안 패치 등의 작업을 고려해야 한다.

 

2) 가용성 관리 평가 항목 정의

매월, 매 분기별로 각 시스템의 미리 계획했던 서비스 시간 대비 실제 서비스 시간을 계산하여 가용성을 산정한다. 이 단계에서는 가용성을 단순 퍼센트(%)로 계산하는 것 외에도 여러가지 평가 항목을 정의하고 관리해야 한다. 가용성 평가 항목에는 시스템 또는 서버의 가동률, 장애 건수, 장애 발생 후 시스템 복구 시간, 장애로 인한 서비스 영향도 등이 있다. 가용성 계산 결과 및 각 항목에 대한 평가서는 주기적으로 레포트로 작성하고 검토한다.

 

3) 가용성 관리 활동 및 가용성 관리 계획 수립

I. 가용성 관리 목표 설정

가용성 관리의 목표는 일정 수준 이상의 가용성을 제공하는 것이다. 이 안에는 IT 인프라 운영 환경의 최적화, 사업 목표 달성, 경제적인 가용성 제공 등이 포함된다.

 

II. 가용성 관리 범위 정의

가용성 관리에 해당하는 업무를 정의한다. 가용성 관리 업무는 가용성에 대한 비즈니스 요구사항이 지속적으로 만족한다는 것을 보증해야 한다. 이를 위한 가용성 제공방안, 설계방안, 이행방안, 측정방안에 대해 정의한다.

 

III. 가용성 관리 프로세스 수립

이 절차에서는 가용성 계획 초기부터 마무리까지의 전체 프로세스를 구성한다.

① 가용성 계획을 수립한다. 가용성 계획 단계에서는 IT 시스템이나 애플리케이션 등의 가용성을 어떻게 개선하는지와 각 오브젝트 간 우선순위 등을 설정하고 일정을 계획한다.

② IT 서비스 중단이 발생했을 때 비즈니스에 어떤 영향을 끼치는 지를 파악한다. 또한 영향을 최소화하기 위해 장애 복구 기술 구현방안을 설계하고 검토한다.

③ IT 시스템이나 애플리케이션의 가용성, 신뢰성, 유지 보수 역량 등에 대한 목표를 설정한다. 이는 서비스 수준 약정서, 운영 수준 약정서, 외부 계약서 등의 문서를 통해 합의하고 관리한다.

④ 가용성 목표로 설정한대로 실제 가용성 기능을 구현한다.

⑤ 지속적인 모니터링 및 관리를 통해 시스템의 평균적인 장애 발생 시간, 시스템의 평균 가동 시간(MTBF), 시스템 장애 발생 후 평균 복구 시간(MTTR) 등을 분석한다. 분석된 내용을 바탕으로 필요에 따라 서비스 중단 시간을 계획하거나 시스템 백업 주기를 결정한다.

⑥ 가용성, 신뢰성, 유지 보수 역량을 측정하고 이를 레포트로 작성하고 보고한다.

 

IV. 가용성 관리 조직 및 역할 정의

가용성 관리에 필요한 역할에는 가용성 관리자와 IT 시스템별 담당자 등이 있다. 가용성 관리자는 IT 서비스의 가용성 관리를 위한 총괄 책임자로서, IT 인프라 전반에 걸쳐 다양하고 숙련된 경험을 갖춘 특급 컨설턴트 수준이어야 한다. IT 시스템별 담당자는 담당사업 부서나 사용자의 요구사항을 분석하면서, 각 관리하는 인프라, 시스템, 애플리케이션의 가용성을 개선한다.

 

V. 용량 관리에 대한 품질 지표 보고

용량 관리 중 중요한 업무는 주어진 정보를 잘 활용해서 향후를 예측하는 업무이다. 분석된 자료를 기반으로 향후 용량을 예측하고, 비용을 얼마나 절감할 수 있는지 산정하고, 고객의 요구사항을 얼마나 더 충족시킬 수 있는지 파악한다. 그리고 용량 관리의 전반적인 품질을 파악할 수 있도록 도출된 내용으로 품질 지표를 작성하여 보고한다.

IT 인프라의 사용량은 특정 모니터링 툴을 통해 각 시스템별 사용량을 취합한다. 이 사용량 결과는 주기적으로 모니터링하고 시스템의 이용률이 각 벤더에서 제공하는 적정치를 충족하는지 확인하고 이러한 내용을 품질 지표로 문서화하고 관리하면서 용량 관리 품질을 향상시킨다.

또한 용량을 예측하는 방법론이나 툴을 이용하여 용량 모델링(예측치)의 정확도를 측정하는 것도 중요하다. 실제 비즈니스나 서비스에서 요구되는 정보를 통해 예측치를 계산한 값과 실제 사용한 값을 비교하여 정확도를 파악하고, 이를 품질 지표로 관리하면서 모델링의 정확도를 점차 개선한다.

반응형