333. RAID 1 (미러링) — Brain Science

핵심 인사이트 (3줄 요약)

본질: RAID (Redundant Array of Independent Disks) 1은 같은 데이터를 두 개 이상의 디스크에 그대로 복제해, 성능보다 가용성과 단순한 복구를 우선하는 미러링 구조다.

가치: 디스크 한 대가 고장 나도 남은 복제본이 즉시 서비스를 이어받으므로, 부팅 볼륨이나 핵심 시스템 영역에서 중단 시간을 매우 짧게 만들 수 있다.

판단 포인트: RAID 1은 용량 효율이 50% 수준으로 낮고 논리적 삭제까지 막아주지 않으므로, 작지만 중요한 데이터 영역 보호에 적합하며 백업과는 반드시 분리해서 이해해야 한다.

Ⅰ. 개요 및 필요성

RAID 1은 하나의 논리 볼륨을 두 개 이상의 물리 디스크에 거울처럼 동일하게 저장하는 미러링 방식이다. 운영체제는 하나의 디스크처럼 보지만, 실제 저장 계층에서는 같은 블록이 여러 장치에 동시에 기록된다. 그래서 특정 디스크가 갑자기 고장 나더라도 서비스는 남아 있는 복제본으로 계속 동작할 수 있다.

이 방식이 필요한 이유는 저장장치 고장이 드문 사건이 아니라 언젠가 반드시 발생하는 사건이기 때문이다. 특히 서버의 OS (Operating System) 부팅 영역, 가상화 호스트의 하이퍼바이저, 소규모 데이터베이스의 로그 영역처럼 "용량은 작지만 멈추면 치명적인" 구간은 디스크 한 대의 실패가 곧 서비스 중단으로 이어진다. RAID 1은 이 문제를 복잡한 수학 대신 그냥 똑같이 하나 더 둔다는 가장 직관적인 방식으로 해결한다.

즉 RAID 1의 필요성은 속도 향상보다 예측 가능한 장애 대응에 있다. 장애가 났을 때 패리티를 계산하거나 여러 디스크를 역산하지 않고, 살아 있는 사본을 바로 읽으면 되기 때문이다. 이 단순함 덕분에 설계 설명도 쉽고, 장애 복구 절차도 비교적 명확하다.

📢 섹션 요약 비유: 중요한 계약서를 한 금고에만 넣어두면 금고가 망가질 때 함께 끝난다. RAID 1은 같은 계약서를 다른 금고에 동시에 넣어 두어, 한쪽 금고가 망가져도 업무를 계속하게 만드는 방식이다.

Ⅱ. 아키텍처 및 핵심 원리

RAID 1의 핵심은 쓰기 시 동시 복제, 읽기 시 선택 또는 분산 읽기, 장애 시 즉시 대체라는 세 단계로 요약된다. 컨트롤러나 소프트웨어 RAID 계층은 상위 시스템의 한 번의 쓰기 요청을 받아 두 디스크에 같은 블록 주소로 기록한다. 읽기 요청은 두 디스크 중 더 빨리 응답 가능한 장치에서 처리하거나, 구현에 따라 읽기 부하를 분산할 수 있다.

구성 요소	역할	설계 포인트
RAID 컨트롤러 또는 소프트웨어 RAID	논리 볼륨을 제공하고 미러 상태를 관리	장애 감지, 재동기화, 읽기 정책
주 디스크 (Primary)	정상 시 읽기/쓰기 참여	성능, 펌웨어 안정성
미러 디스크 (Mirror)	동일 블록의 복제본 보관	동일 용량, 유사 성능 권장
리빌드 (Rebuild) 절차	새 디스크에 전체 블록 재복제	재동기화 시간과 운영 부하

아래 그림은 RAID 1이 단순 복사가 아니라 정상 운영, 장애 운영, 복구 운영을 하나의 흐름으로 다룬다는 점을 보여준다.

┌──────────────────────────────────────────────────────────────────────┐
│                  RAID 1 데이터 흐름과 장애 전환 구조                │
├──────────────────────────────────────────────────────────────────────┤
│ Host Write/Read                                                     │
│      │                                                              │
│      ▼                                                              │
│  ┌───────────────┐                                                  │
│  │ RAID Layer    │                                                  │
│  │ - write clone │                                                  │
│  │ - read select │                                                  │
│  └──────┬────────┘                                                  │
│         │                                                           │
│   ┌─────┴─────┐                                                     │
│   ▼           ▼                                                     │
│┌──────────┐ ┌──────────┐                                            │
││ Disk A   │ │ Disk B   │                                            │
││ A B C D  │ │ A B C D  │  ← 동일 블록 복제                          │
│└────┬─────┘ └────┬─────┘                                            │
│     │            │                                                  │
│     │ failure    │ survives                                         │
│     └──────┐ ┌───┘                                                  │
│            ▼ ▼                                                      │
│        Degraded Mode                                                │
│            │                                                        │
│            ▼                                                        │
│      New Disk Inserted                                              │
│            │                                                        │
│            ▼                                                        │
│      Rebuild from survivor                                          │
└──────────────────────────────────────────────────────────────────────┘

성능은 읽기와 쓰기가 다르게 나타난다. 쓰기는 같은 데이터를 두 번 기록해야 하므로, 이상적으로는 단일 디스크 수준에 가깝거나 약간 낮아질 수 있다. 반면 읽기는 두 사본 중 상태가 좋은 장치를 선택하거나 읽기 부하를 나눌 수 있어, 랜덤 읽기 중심 환경에서는 이점이 나타날 수 있다. 다만 RAID 1의 핵심 목적은 어디까지나 읽기 가속보다 장애 허용과 단순 복구다.

장애가 발생하면 배열은 보통 Degraded Mode로 전환된다. 이 상태에서는 한쪽 복제본만으로 서비스를 지속하지만, 남은 디스크까지 잃으면 전체 볼륨을 잃는다. 이후 새 HDD (Hard Disk Drive) 또는 SSD (Solid State Drive)를 장착하면 살아 있는 디스크의 내용을 새 장치로 다시 복제하는 리빌드가 진행된다.

📢 섹션 요약 비유: 두 명의 속기사에게 같은 회의록을 동시에 쓰게 하면 작성 비용은 더 들지만, 한 명이 자리를 비워도 다른 한 명의 노트로 회의를 이어갈 수 있다. 그리고 새 속기사가 오면 남아 있는 노트를 그대로 베껴 다시 팀을 복구하면 된다.

Ⅲ. 비교 및 연결

RAID 1의 경계를 분명히 이해하려면 RAID 0, RAID 5와 함께 비교해야 한다. RAID 0은 데이터를 분산 저장해 성능과 용량 효율을 얻지만, 어느 한 디스크만 고장 나도 전체 볼륨을 잃는다. RAID 5는 패리티를 이용해 용량 효율과 내결함성을 절충하지만, 패리티 계산과 리빌드 부담이 따라온다. RAID 1은 이 둘 사이에서 가장 단순한 복제 전략으로, 계산 복잡도 대신 저장 공간을 희생한다.

항목	RAID 0	RAID 1	RAID 5
핵심 방식	스트라이핑	미러링	분산 패리티
최소 디스크 수	2	2	3
용량 효율	높음	낮음(보통 50%)	중간
디스크 1대 고장 시	전체 손실	서비스 지속 가능	서비스 지속 가능
복구 복잡도	복구 불가	단순 복제	패리티 재계산 필요
적합한 용도	임시 성능 중심 작업	부팅/핵심 시스템 볼륨	용량과 안정성 절충

또한 RAID 1은 RAID 10의 기반이 된다. RAID 10은 먼저 RAID 1로 미러 쌍을 만든 뒤, 그 위를 RAID 0처럼 스트라이핑해 성능과 복원력을 함께 노린다. 따라서 RAID 1은 단독 구성으로도 중요하지만, 상위 조합 RAID를 이해하는 출발점이기도 하다.

가장 자주 혼동되는 연결 개념은 백업 (Backup) 이다. RAID 1은 디스크 고장에는 강하지만, 사용자가 파일을 잘못 삭제하거나 랜섬웨어가 파일을 암호화하면 그 변경 내용도 양쪽 디스크에 똑같이 반영된다. 즉 RAID 1은 하드웨어 장애 대응이고, 백업은 시간을 되돌리는 복구 수단이라는 점에서 역할이 다르다.

📢 섹션 요약 비유: RAID 0은 짐을 여러 차에 나눠 싣는 고속 배송이고, RAID 5는 보험을 든 공동 운송에 가깝다. RAID 1은 같은 짐을 똑같은 두 대의 차에 실어 보내는 방식이라 돈은 더 들지만, 한 대가 멈춰도 배송은 계속된다.

Ⅳ. 실무 적용 및 기술사 판단

실무에서 RAID 1은 "대용량 저장소"보다 "멈추면 곤란한 소용량 핵심 영역"에 더 잘 맞는다. 대표적으로 서버 부팅 디스크, 관리용 데이터베이스, 인증 서버의 시스템 볼륨, 가상화 호스트의 하이퍼바이저 설치 영역 등이 여기에 해당한다. 이런 영역은 수십 테라바이트가 필요하지 않지만, 디스크 한 대 고장으로 재설치와 복구 시간을 겪으면 운영 손실이 커진다.

판단 기준

중단 회피가 용량 효율보다 중요한가? 그렇다면 RAID 1이 유리하다.
리빌드가 단순해야 하는가? 운영 인력이 적고 장애 절차를 단순화해야 하면 적합하다.
저장 용량이 크게 필요한가? 그렇다면 RAID 5, RAID 6, 오브젝트 스토리지 등을 먼저 검토해야 한다.
백업 체계가 별도로 있는가? 없으면 RAID 1만으로는 보호 전략이 불완전하다.

자주 나오는 안티패턴

RAID 1을 구성했으니 백업이 필요 없다고 판단하는 경우
용량이 큰 파일 서버에 무조건 RAID 1을 적용해 비용을 과도하게 높이는 경우
서로 성능과 상태가 크게 다른 디스크를 억지로 미러링해 병목과 장애 위험을 키우는 경우

실무 면접이나 기술사 답안에서는 RTO (Recovery Time Objective) 와 운영 단순성을 함께 언급하면 좋다. RAID 1은 디스크 단일 장애에 대한 복구 시간을 짧게 만들지만, 저장 효율이 낮아 전체 비용은 증가한다. 따라서 "작고 중요한 영역은 RAID 1, 크고 비용 민감한 영역은 다른 보호 방식"이라는 식의 구분 판단이 핵심이다.

📢 섹션 요약 비유: 모든 짐을 복사해서 운반하면 비용은 너무 커진다. 하지만 회사 인감도장처럼 잃어버리면 바로 업무가 멈추는 물건은 복사본을 따로 두는 편이 훨씬 안전하다.

Ⅴ. 기대효과 및 결론

RAID 1의 가장 큰 효과는 저장장치 한 대의 물리적 고장을 즉시 서비스 중단으로 연결하지 않게 만든다는 점이다. 장애 대응 절차가 직관적이어서 운영자가 상태를 이해하기 쉽고, 리빌드도 살아남은 복제본을 그대로 복사하면 되므로 다른 RAID 레벨보다 설명 가능성이 높다. 이 때문에 부팅 볼륨이나 관리 시스템처럼 "복잡한 복구보다 빠른 지속 운영"이 중요한 환경에서 오랫동안 사랑받는다.

반면 한계도 분명하다. 실제 사용 가능한 용량이 절반 수준으로 줄고, 두 번째 디스크까지 잃으면 보호가 끝나며, 논리적 손상과 오삭제는 막지 못한다. 특히 대용량 스토리지 전체를 RAID 1로 설계하면 비용 효율이 급격히 나빠지므로, 항상 보호 목표와 데이터 성격을 먼저 따져야 한다.

정리하면 RAID 1은 "가장 단순하지만 가장 설명하기 쉬운 고가용성 저장 전략"으로 기억하면 된다. 복잡한 연산 없이 동일 사본을 만들어 장애를 견디는 방식이므로, 핵심 시스템의 첫 번째 방어선으로는 매우 강력하지만, 전체 데이터 보호 전략의 전부는 아니다.

📢 섹션 요약 비유: RAID 1은 튼튼한 예비 타이어와 같다. 바퀴 하나가 터져도 곧바로 달릴 수 있게 해 주지만, 자동차 정비 전체를 대신해 주지는 않는다.

📌 관련 개념 맵

개념	연결 포인트
RAID 0 (Striping)	성능과 용량 효율을 높이지만 내결함성이 없는 반대 극단
RAID 5 (Distributed Parity)	용량 효율과 장애 허용을 절충하는 비교 대상
RAID 10	RAID 1 미러 쌍을 기반으로 성능을 확장한 조합 RAID
Rebuild	장애 후 새 디스크에 데이터를 다시 동기화하는 절차
Backup	RAID 1이 막지 못하는 논리적 손상을 복구하는 별도 보호 체계

📈 관련 키워드 및 발전 흐름도

단일 디스크 저장
    │
    ▼
RAID 1 (Mirroring)
    │
    ├─▶ Rebuild · Hot Swap
    │
    ▼
RAID 10
    │
    ▼
고가용성 스토리지 설계
    │
    ▼
RAID + Snapshot + Backup 분리 전략

이 흐름은 단순 복제에서 시작해, 장애 교체 절차와 조합 RAID를 거쳐, 최종적으로는 스냅샷과 백업까지 분리하는 현대적 보호 전략으로 확장되는 과정을 보여준다.

👶 어린이를 위한 3줄 비유 설명

RAID 1은 중요한 그림을 한 장만 그리지 않고 똑같이 두 장 그려 두는 거예요.
한 장이 찢어져도 다른 한 장이 남아 있어서 바로 다시 보여줄 수 있어요.
하지만 종이를 두 장 써야 하니까, 안전해지는 대신 많이 담을 수는 없어요.