[데이터보안] 재해복구시스템(DRS:Disater Recovery System)
재해복구시스템(DRS : Disaster Recovery System)
천재지변이나 해킹 등 각종 재난/재해로 인해 IT 인프라에 장애가 발생하여 제 기능을 수행하지 못하게 되었을 경우, 서비스 연속성을 보장하기 위해 이를 대체하거나 복구하여 제 기능을 수행할 수 있도록 하는 시스템
재해복구 대책에 대한 법적인 규제 추세(금융감독원 권고안 발표)이다
구성 요소
-
BIA(Business Impact Analysis)
재해가 비지니스에 영향을 미치는 정도를 분석하는 작업 -
DOMAIN
영향도 별 그룹화(복구 우선순위 별 그룹화) -
RTO(Recovery Time Object)
재해 상황에서 서비스가 복구되어야 할 최대 시간 -
RPO(Recovery Point Objective)
재해 상황에서 수용할 수 있는 최대 허용 데이터 손실 -
DR 센터 선정
주 센터와 복구 센터 위치 선정 -
백업 방안
Hot Standby, DB Shadowing, 원격 백업, OS 백업, 단순백업 -
운영 방안
조직체계, 평상시/재해시 운영절차, 모의 훈련 절차
기술적 요소
-
HA(고가용성 : High Availability)
서버와 네트워크 등의 정보 시스템이 지속적으로 정상 운영이 가능한 성질
2개의 서버 중 1대의 서버에서 장애가 발생하면 다른 서버가 대처
레이드(RAID) 방식과 샌(SAN) 방식을 주로 사용 -
결함 허용(FT)
시스템을 구성하는 푸품의 일부에서 결함(Fault) 또는 고장(Failure)이 발생하여도 정상적 혹은 부분적으로 기능을 수행할 수 있는 시스템 -
SAN(Storage Area Network)
대량의 데이터를 집중시켜 보관하고 이를 구성하는 장비들을 이용, 공유하여 사용할 수 있도록 하는 기술.
다만, 별도의 Fibre Channel 네트워크를 구성해야 한다 -
IP-SAN
기존의 TCP/IP 망을 그대로 이용하여 별도의 Fibre Channel 네트워크를 구성해야하는 기존 SAN의 단점을보완
, 속도는 크게 떨어지지 않는 기술 -
Fibre Channel(파이버 채널 : FC)
주로 스토리지 네트워킹에 쓰이는 기가 비트 속도의 네트워크 기술 -
WDM(파장 분할 다중화 :Wavelength Division Multiplexing)
한 가닥의 광섬유에 여러 채널을 통해 파장을 동시에 전송하는 기술 -
DWDM(Dense WDM)
일정 파장 대역에 걸쳐 수십, 수백개의 파장의 광 신호를 동시에 변조시켜서 하나의 광섬유를 통해 전송하는 WDM의 발전된 기술 -
CWDM(Coarse WDM)
DWDM과 유사하나, 파장 간격이 보다 넓고(~10nm 이상) 광증폭기를 잘 사용하지 않는단거리
전송에 주로 사용
재해복구 구축 절차
-
업무 영향 분석
BIA, DOMAIN, RTO, RPO 등의 적용과정
재해로 인한 핵심 프로그램 들의 가동 중단 시 파급영향 분석 및 그에 따른 복구 우선순위를 설정 -
재해복구 전략 수립
대상 별 복구 전략, 복구 솔루션 선전 및 재해복구센터 선정 -
시스템 구축 및 복구 계획 수립
재해복구 시스템 구축 및 업무와 전산시스템의 복구를 위한 상세 계획 수립 -
운영 및 모의 훈련
수립된 계획의 주기적 테스트를 통한 미비점 파악 및 보완
계획 수립 시 고려사항
-
RSO(복구 목표 대상/범위 : Recovery Scope Objective)
정보의 중요성과 복구 우선순위 지정의 기본 지표가 된다 -
RTO(복구 목표 시간 : Recovery Time Objective)
시스템 복구까지 허용할 수 있는 최대 시간 -
RPO(복구 목표 지점 : Recovery Point Objective)
목표 복구 시점, 데이터 손실을 시간으로 환산한 개념 -
RCO(통신 복구 목표 : Recovery Communications Objective)
네트워크 복구 수준 -
BCO(목표 백업 센터 : Backup Center Objective)
백업 센터 구축 및 관리 방법
구축 형태
-
독자구축
단일 기관 전용의 DRS를 독자적으로 구축
보안 유지 및 복구의 신뢰성이 가장 높음
구축 및 유지비용이 가장 많이 소요 -
공동구축
두 개 이상의 기관이 DRS를 공동으로 구축 및 이용
비교적 적은 구축 및 유지비용
보안 및 운용 측면에서 고려할 사항이 많고, 광역재해 발생 시 공동이용기관간의 동시 재해복구 불가 -
상호구축
단일 기관의 여러 개 사이트 또는 두 개 이상 기관의 사이트 상호간 DRS의 역할을 수행
가장 적은 구축 및 유지 비용
상호 기관 작업에 종속
서로 다른 기관간의 보안성 및 재해복구에 대한 신뢰성이 낮음 -
외부위탁
재해 복구 전문 서비스 업체에 위탁하여 운영
전문기술 지원 가능
정보 유출, 보안 및 신뢰성 문제
시스템 구성요소 별 복제방식
-
H/W (Disk) 복제
디스크 간 복제
안정성/고성능, 높은비용
Shadow Copy, True Copy -
S/W (OS) 복제
OS 수준 솔루션
안정성/효율성, 비교적 낮은 비용
Shareplex, Oracle Golden Gate -
S/W (DBMS) 복제
DBMS 기능 기용
안정성/효율성, 비교적 낮은 비용
Orcle RAC
데이터 동기화 기법
스토리지 데이터 복제 방식
Active-Active 스토리지 방식
동기방식으로 스토리지 1, 2가 하나의 저장공간으로 ㄷ오작하며 웹서버1(Active), 웹서버2(Active)가 각각 로컬 스토리지에 Write/Read가 가능
구성 시 CWDM/DWDM으로 구현, 지연시간에 따라 센터간 50KM이내 권장
스토리지 데이터 동기 복제 기법
실시간 동기 방식(Synchronous Data Replication)
서버가 로컬 스토리지에 저장 시 원격 스토리지에도 저장 후 응답을 받고 나서 서버에게 최종 응답을 전달 - Zero RPO, 거리 제약(50Km ~ 300Km)
동기 복제
: SCSI(FC)는 한 번 동작이 메시지를 2차례를 주고 받는다.
즉, 50KM 거리에서 SCSI 한 번 동작 시 1ms 지연 발생
스토리지 데이터 비동기 복제 기법
비동기 방식(Asynchronous Data Replication)
서버가 로컬 스토리지에 저장 이후 리모트 스토리지에 저장 - 거리 제약 없음
수준별 유형
미러사이트(Mirror Site)
- 주 센터와 동일한 수준의 정보기술자원을 원격지에 구축, Active Active 상태로 실시간 동시 서비스 제공
- 복구소요시간(RTO) : 즉시
- 데이터 최신성, 높은 안정성, 신속한 업무 재개
- 높은 초기투자비용, 높은 유지보수 비용, 데이터 업데이트가 많은 경우 과부하 야기
핫사이트(Hot Site)
- 주센터와 동일한 수준의 정보기술자원을 원격지에 구축 후 Active Stanby 상태로 유지
- 재해 발생 시 Active 상태로 전환
- 데이터는 동기적 또는 비동기적 방식으로 실시간 미러링을 통하여 최신상태 유지
- 복구소요시간(RTO) : 수 시간 이내
- 데이터 최신성, 높은 안정성, 신속한 업무 재개, 데이터 업데이트가 많은 경우 적합
- 높은 초기투자비용, 높은 유지보수비용
웜사이트(Warm Site)
- 중요성이 높은 정보기술자원만 부분적으로 재해복수센터에 보유
- 데이터는 주기적으로 백업
- 복구소요시간(RTO) : 일 단위 ~ 주 단위
- 구축 및 유지비용이 핫사이트에 비해 저렴
- 데이터 손실 다소 발생, 초기복구수준이 부분적, 복구소요시간이 길다
콜드사이트(Cold Site)
- 데이터만 원격지에 보관하고 이의 서비스를 위한 정보자원은 확보하지 않거나 장소 등 최소한으로 확보
- 재해 발생 시 데이터를 근간으로 필요한 정보자원을 조달하여 정보시스템의 복구 개시
- 데이터는 주기적으로 원격지에 백업
- 복구소요시간(RTO) : 주 단위 ~ 달 단위
- 구축 및 유지비용이 가장 저렴
- 데이터 손실 발생, 복구에 매우 긴 시간 소요, 복구 신뢰성이 낮다
DRS 도입 효과
-
재무적 관점
ROI, TCO
서비스 연속성을 통한 투자 대비 효과
비용 증가 대비 가시성 효과 증대 -
고객 관점
위험 대비 체계적 고품질 서비스
서비스 안정화로 고객 만족 -
프로세스 관점
서비스 안정성 기반 생산성 증대
체계적 관리로 업무 효율성 향상
BCP(Business Continuous Planning)과의 비교
구분 | DRS | BCP |
---|---|---|
적용시점 | 재해 사후 | 재해 사전/후(평시, 비상시 연속) |
목적 | 정보시스템 인프라와 사업 운영에 필수적인 정보자산의 복구를 촉직하기 위한 상세한 절차를 제공 | 심각한 중단 상황에서 복구가 진행되는 동안에 필수적인 사업을 유지하기 위한 절차를 제공 |
범위 | IT서비스 중심. BIA에 따른 RTO, RPO를 고려한 서버, 스토리지, 네트워크 구축 | 실제의 업무 프로세스와 업무 프로세스를 지원하기 위한 IT 영역에 집중 |
실행 주체 | 정보시스템 부서가 절차중심으로 수행 | 각 비지니스 부서가 계획중심으로 수행 |
대상 | IT운영팀을 중심으로 운영시설을 사업단위 중심으로 수행 | 업무는 물론 사람, 물리적 사무공간, 중요 문서등을 포함하여 사전에 준비하기 어려운 수많은 항목이 대상 |
구축 결과물 | DRP(Disaster Recovery Plan)과 사전 계획 문서 | 재해복구계획, 업무복구계획, 대체프로세스계획, 업무비상계획 |
댓글남기기