핵심 인사이트 (3줄 요약)
- 기업 데이터의 80% 이상은 생성된 지 한 달만 지나면 아무도 쳐다보지 않는 **콜드 데이터(Cold Data)**로 변한다. (예: 10년 전 세금 영수증, 병원의 과거 X-ray 사진, CCTV 1년 치 녹화본)
- 이 거대한 쓰레기 더미를 비싼 SSD나 메인 서버(Hot Tier)에 그대로 놔두면 유지비와 전기세 때문에 회사가 파산하므로, 이를 가장 값싼 매체로 옮겨 밀봉하는 것을 **아카이빙(Archiving)**이라 한다.
- 콜드 데이터 저장을 위한 궁극의 하드웨어는 클라우드의 오브젝트 스토리지(예: AWS Glacier)나, 전기를 아예 먹지 않고 30년을 버티는 자기 테이프(LTO Tape) 및 MAID(전원 차단 하드디스크)다.
Ⅰ. 콜드 데이터의 딜레마 (버릴 수 없는 쓰레기)
은행에 있는 10년 치 거래 내역 데이터를 생각해 봅시다.
- 99.99% 확률로 내일 아무도 그 데이터를 검색하지 않습니다. (온도가 매우 낮은 Cold Data)
- "그럼 지우면 되지 않나?" 절대 안 됩니다. 금융감독원 법률상 10년간 무조건 보존해야 하며, 만약 소송이 걸리면 즉시 법원에 제출해야 하기 때문입니다.
즉, "절대 안 보지만, 절대 지울 수도 없는" 수십 페타바이트(PB)의 거대한 짐 덩어리입니다. 이 짐 덩어리를 어떻게 가장 싸게, 전기를 안 쓰면서, 해킹 안 당하게 보관할 것인가가 인프라 설계자의 몫입니다.
📢 섹션 요약 비유: 초등학교 때 쓴 일기장 100권입니다. 평소엔 절대 안 열어보지만 버리기엔 추억이 아깝습니다. 이걸 내 좁고 비싼 원룸 책상(SSD) 위에 올려두는 건 바보짓입니다. 그냥 박스에 꽁꽁 싸서 시골 창고(아카이브)에 처박아 두는 게 정답입니다.
Ⅱ. 콜드 데이터를 품는 하드웨어 (아카이브 매체)
콜드 데이터는 '읽기/쓰기 속도(IOPS)'를 완전히 포기하는 대신 **'1TB당 가격'과 '내구성'**에 올인한 특수 매체를 씁니다.
1. 자기 테이프 (LTO Tape) - 궁극의 가성비
디지털 시대에 웬 비디오테이프냐 싶겠지만, 글로벌 클라우드(구글, MS)와 대형 은행의 지하 창고에는 어마어마한 양의 LTO 테이프들이 굴러가고 있습니다.
- 비용: 1TB당 몇천 원꼴로 하드디스크(HDD)보다 압도적으로 쌉니다.
- 유지비 0원: 디스크는 안 써도 모터가 돌아가 전기(전력)를 먹지만, 테이프는 데이터만 기록하고 선반에 툭 던져두면 전기를 0.001W도 먹지 않습니다.
- 수명과 보안: 상온에서 30년간 보존되며, 랜선이 아예 뽑혀있으므로(Air-gapped) 랜섬웨어나 해커가 절대로 테이프 안의 데이터를 암호화하거나 지울 수 없습니다. (궁극의 보안)
2. MAID (Massive Array of Idle Disks)
테이프는 읽을 때 사람이 카트리지를 기계에 꽂고 테이프를 감아야 해서(수 분 소요) 귀찮습니다. MAID는 하드디스크(HDD) 수천 개를 랙에 꽂아두되, 평소에는 디스크의 모터 전원을 완전히 꺼버려서(Spin-down) 전기를 0으로 만드는 기술입니다. 1년에 한 번 누군가 데이터를 찾을 때만 윙~ 하고 디스크 모터를 켜서(Spin-up) 데이터를 주고 다시 기절합니다.
데이터 온도별 계층 (ASCII)
온 도 매 체 가 격 접근 속도(지연)
♨️ Hot RAM / NVMe SSD $$$$$ 나노초(ns) ~ 마이크로초
🌤️ Warm 일반 SATA SSD $$$ 밀리초(ms)
☁️ Cool 일반 HDD (RAID) $$ 수십 밀리초
❄️ Cold 테이프(LTO) / MAID $ 수 분(min) ~ 수 시간 (꺼내서 꽂아야 함)
📢 섹션 요약 비유: 콜드 아카이빙은 책을 도서관 책꽂이(HDD)가 아니라, **'타임캡슐(자기 테이프)'**에 넣고 땅에 묻어버리는 행위입니다. 유지비(전기)가 0원이고 아무도 훔쳐 갈 수 없지만, 나중에 책이 보고 싶어지면 삽으로 땅을 파서 꺼내는 데(접근 속도) 하루가 걸립니다.
Ⅲ. 클라우드 아카이빙 (AWS Glacier)
테이프를 직접 사서 관리하는 것도 귀찮은 회사들은 클라우드 아카이브 서비스를 씁니다. AWS의 **S3 Glacier (글래시어 = 빙하)**가 대표적입니다. 이름부터 데이터를 '얼려버린다'는 뜻입니다.
- 1TB를 저장하는 데 한 달에 천 원 단위밖에 안 할 정도로 미친 듯이 쌉니다.
- 치명적 트레이드오프: 요금이 싼 대신 데이터를 꺼낼 때(Restore) 끔찍한 페널티가 있습니다. "데이터 지금 다운받을래"라고 누르면, 최대 12시간을 기다려야 다운로드 버튼이 활성화됩니다. (아마존 직원이 지하에서 로봇을 시켜 테이프를 찾아 꽂아주는 물리적 시간입니다.) 또한 데이터를 꺼낼 때마다 막대한 '데이터 전송 요금'이 부과되므로, 평소에 자꾸 꺼내 볼 데이터는 절대 이곳에 얼려두면 안 됩니다.