62. 백업 및 아카이빙 정책 감리

⚠️ 이 문서는 랜섬웨어, 하드웨어 장애, 사용자 실수 등으로부터 데이터를 안전하게 보호하기 위해, 단순히 파일을 복사해 두는 것을 넘어 데이터의 중요도에 따라 백업 종류(Full, Incremental, Differential)와 보관 주기(Archiving)를 어떻게 설계하고 운영해야 하는지 점검하는 감리 핵심 지표를 다룹니다.

핵심 인사이트 (3줄 요약)

  1. 본질: "데이터를 매일 백업하고 있는가?"라는 단순한 질문이 아니라, "장애 발생 시 1시간 내에 복구할 수 있도록 백업 본들이 논리적으로 연결되어 있으며, 컴플라이언스(법적 보존 기한)를 충족하는가?"를 묻는 체계적인 데이터 보호 전략이다.
  2. 가치: 백업 매체를 소산(Off-site) 보관하여 데이터센터 화재 시에도 데이터를 살려내고, 장기 보관용 데이터(아카이빙)를 저렴한 테이프(Tape)나 콜드 스토리지로 빼내어 비싼 주 스토리지 비용을 절감한다.
  3. 기술 체계: 데이터 복구 속도(RTO)와 백업 소요 시간 사이의 트레이드오프를 조율하기 위해 전체 백업(Full), 증분 백업(Incremental), 차등 백업(Differential)을 주간/일간 스케줄로 혼합 구성하는 것이 감리의 핵심 점검 대상이다.

Ⅰ. 백업의 3대 유형과 복구의 트레이드오프

모든 데이터를 매일 통째로 백업하는 것은 물리적으로 불가능하다.

  1. 전체 백업 (Full Backup):
    • 매번 전체 데이터(1TB)를 통째로 복사한다.
    • 장점: 복구가 가장 빠르다 (가장 최근의 Full 백업본 1개만 부어 넣으면 끝).
    • 단점: 백업 시간이 너무 오래 걸리고 스토리지 용량을 엄청나게 낭비한다. (주로 주말에 1회 수행)
  2. 증분 백업 (Incremental Backup):
    • '바로 직전'에 수행된 백업(종류 무관) 이후에 변경된 데이터(예: 10GB)만 복사한다. 월요일엔 일요일 변경분, 화요일엔 월요일 변경분만 백업한다.
    • 장점: 백업 시간이 가장 짧고 용량도 가장 적게 든다.
    • 단점: 목요일에 장애가 터지면, '일요일 Full + 월, 화, 수, 목 증분' 파일을 모두 순서대로 다 찾아야만 복구할 수 있어 복구 시간(RTO)이 가장 오래 걸리고 중간에 하나라도 파일이 깨지면 복구가 불가능하다.
  3. 차등 백업 (Differential Backup):
    • '가장 최근의 전체 백업(Full Backup)' 이후에 변경된 모든 데이터를 매일 복사한다. 수요일엔 월+화+수 변경분을 백업한다.
    • 증분 백업과 전체 백업의 단점을 절충한 방식이다. 목요일 장애 시 '일요일 Full + 목요일 차등' 단 2개의 파일만 있으면 복구된다.

📢 섹션 요약 비유: 전체 백업이 매일 일기장을 통째로 새로 복사하는 것이라면, 증분 백업은 어제 쓴 일기 내용만 쪽지에 적는 것이고, 차등 백업은 이번 주 월요일부터 오늘까지 쓴 일기를 매일 다시 묶어서 복사하는 방식입니다.


Ⅱ. 백업 vs 아카이빙(Archiving)의 본질적 차이

이 둘을 헷갈리면 막대한 스토리지 비용 낭비가 발생한다.

  1. 백업 (Backup) = 복사본 (Copy):
    • 주 센터의 원본 데이터가 날아갔을 때 되살리기 위한 '보험용 복사본'이다.
    • 수명: 짧다 (보통 1주~1달 보관 후 덮어씀). / 매체: 빠른 디스크 (VTL 등).
  2. 아카이빙 (Archiving) = 이관 (Move):
    • 자주 쓰지는 않지만 법적 의무(예: 의료기록 10년 보관, 금융기록 5년 보관) 때문에 보관해야 하는 '원본 데이터의 이사'다.
    • 수명: 영구적 (수년~수십 년). / 매체: 저렴하고 느린 테이프(Tape)나 클라우드 빙하(Glacier) 스토리지.
    • 아카이빙된 데이터는 주 서버(비싼 디스크)에서 완전히 삭제되므로, 시스템 성능 향상과 스토리지 비용 절감을 가져온다.

📢 섹션 요약 비유: 백업이 혹시 모를 분실에 대비해 여권 사본을 지갑에 넣고 다니는 것이라면, 아카이빙은 더 이상 안 입는 겨울옷을 안방 옷장(비싼 디스크)에서 빼서 창고(테이프)에 옮겨두어 안방을 넓게 쓰는 정리정돈입니다.


Ⅲ. 감리 시 핵심 점검 체크리스트 (3-2-1 법칙)

감리인은 백업 정책이 문서로 끝나는지, 실제 재난을 방어할 수 있는지 확인해야 한다.

  1. 3-2-1 백업 룰 준수 여부:
    • 최소 3개의 복사본을 유지할 것.
    • 2가지 서로 다른 매체(예: 디스크와 테이프)에 저장할 것.
    • 1개의 복사본은 반드시 본사와 멀리 떨어진 소산(Off-site) 원격지에 보관할 것. (데이터센터 화재 대비)
  2. 랜섬웨어 방어 (WORM Storage):
    • 백업 서버마저 랜섬웨어에 감염되어 파일이 암호화되는 사태를 막기 위해, 백업 파일이 저장된 후에는 관리자조차 수정이나 삭제를 할 수 없는 WORM(Write Once Read Many) 속성의 스토리지가 적용되었는지 점검한다.
  3. 주기적인 복구 테스트 (Recovery Test):
    • 백업이 성공적으로 100% 완료되었다고 로그에 찍혀도, 막상 복구 스크립트를 돌리면 파일이 깨져서 안 열리는 경우가 빈번하다. 감리인은 주기적으로 무작위 백업본을 꺼내어 실제 운영 환경과 똑같이 복구해 보는 '정합성 테스트 일정'이 잡혀있는지 필히 점검한다.

📢 섹션 요약 비유: 보험금(백업)을 매달 꼬박꼬박 냈는데 막상 사고가 났을 때 보험사 약관(파일 깨짐) 때문에 돈을 한 푼도 못 받는 사태를 막기 위해, 감리인이 나서서 보험 약관을 꼼꼼히 살피고 가상 청구까지 해보는 필수 감사 과정입니다.