💡 핵심 인사이트
BCP(Business Continuity Plan)는 지진, 화재, 테러, 대규모 랜섬웨어 공격 등 기업의 숨통을 끊을 수 있는 재난이 터졌을 때, **회사가 망하지 않고 '핵심 비즈니스(돈줄)'를 어떻게든 중단 없이(연속성) 이어나가기 위한 전사적인 마스터플랜(매뉴얼)**입니다.
IT 시스템 복구뿐만 아니라, 직원 대피, 대체 사무실 확보, 언론 통제 등 회사 전체의 생존 전략을 포괄합니다.
Ⅰ. BCP(비즈니스 연속성 계획)의 개념과 필요성
- 과거의 재해 복구(DR): 1990년대까지는 전산실 서버가 불타면 테이프 백업본을 가져다 서버만 다시 켜는 IT 부서만의 국지적 문제(DR)로 여겼습니다.
- BCP의 등장 (9.11 테러의 교훈): 2001년 세계무역센터 폭 테러 당시, 데이터 백업은 잘해놨지만 그 데이터를 다룰 핵심 직원들이 희생되고 출근할 사무실이 파괴되자 수많은 월스트리트 금융사들이 영구 파산했습니다.
- 이때의 교훈으로 "서버만 살려서는 소용없다. **사람, 업무 프로세스, 대체 사업장 등 전사적 차원에서 비즈니스가 멈추지 않게 하는 거대한 훈련과 매뉴얼(BCP)**이 필요하다"는 개념이 정립되었습니다.
Ⅱ. BCP 수립을 위한 핵심 선행 작업 2가지
비상 계획을 짜려면, 우리 회사에서 "무엇이 가장 중요하고, 터지면 얼마짜리 타격이 오는지"를 먼저 조사해야 합니다.
1. BIA (Business Impact Analysis, 업무 영향 분석) ★시험 단골★
- 회사의 수백 개 부서와 업무 중, **'24시간 안에 복구 못하면 회사가 망하는 최우선 핵심 업무'**를 골라내는 우선순위 평가 작업입니다.
- 예: 쿠팡에서 화재가 났을 때, 직원 복지몰 시스템은 일주일 죽어도 상관없지만(우선순위 낮음), 결제 게이트웨이와 배송 추적 시스템은 1시간만 죽어도 수십억 원의 손실(재무적 영향)과 언론의 뭇매(비재무적 영향)를 맞으므로 1순위로 살려야 할 핵심 업무(Mission Critical)로 정의합니다.
2. RA (Risk Assessment, 위험 평가)
- 이 핵심 업무를 타격할 수 있는 '재난의 종류와 발생 확률'을 분석합니다.
- 예: 우리 데이터센터가 강남 저지대에 있으므로 홍수/침수 위험이 '상(High)', 지진 위험은 '하(Low)'라고 평가하여 한정된 방어 예산을 어디에 쓸지 결정합니다.
Ⅲ. BCP의 주요 구성 요소 및 절차
- 초기 대응 및 대피 (Emergency Response): 재난 발생 직후 1~2시간 내의 인명 구조, 대피, 비상연락망(Call Tree) 가동.
- 위기 관리 및 소통 (Crisis Management): 언론 브리핑 및 주주/고객들에게 "안전하게 복구 중입니다"라고 안심시키는 대응.
- 대체 사업장 가동 (Workplace Recovery): 본사 출입이 통제될 경우, 미리 계약해둔 외곽의 오피스나 재택근무 환경으로 핵심 인력을 12시간 내에 재배치.
- IT 재해 복구 (DR, Disaster Recovery): 망가진 메인 서버를 포기하고, 멀리 떨어진 백업 센터(DR 센터)의 장비를 깨워 핵심 결제 시스템을 4시간 내에 살려내는 작업.
📢 섹션 요약 비유: 비행기가 바다에 추락(재난)했을 때, 서버만 고치는 것이 DR이라면, BCP는 승무원이 구명조끼를 나눠주고(대피), 승객들을 구명정에 태운 뒤(대체 사업장), 무전기로 구조대에 연락하여(위기 소통) 비행기가 가라앉더라도 '탑승객의 생존'이라는 본연의 비즈니스를 끝까지 완수해 내는 거대한 탈출 매뉴얼입니다.