핵심 인사이트 (3줄 요약)
- 기업이 1페타바이트(PB)의 데이터를 모두 가장 빠른 NVMe SSD에 저장하려면 수백억 원이 들고, 싼 하드디스크(HDD)에 저장하면 성능이 박살 나서 서비스가 망한다.
- 이를 해결하기 위한 설계가 **스토리지 티어링(Storage Tiering)**이다. 데이터 중 최근 매일 읽히는 **핫(Hot) 데이터 10%만 비싼 SSD(Tier 1)**에 두고, 몇 년 전 자료인 **콜드(Cold) 데이터 90%는 값싼 대용량 HDD(Tier 3)**로 내려보내는 방식이다.
- 과거에는 관리자가 수동으로 옮겼으나, 현대의 스토리지 컨트롤러나 클라우드(AWS S3 등)는 머신러닝을 통해 사용 패턴을 분석하고 데이터를 '자동으로(Automated)' 승급/강등시킨다.
Ⅰ. 저장장치의 영원한 딜레마 (돈 vs 속도)
데이터는 태어난 직후에 가장 많이 읽히고(게시글 작성 직후), 시간이 지날수록 조회 수가 0에 수렴하는 '에이징(Aging)' 곡선을 그립니다.
- 모든 데이터를 비싼 NVMe SSD(1TB당 20만 원)에 두면: 속도는 최고지만, 아무도 안 보는 10년 전 영수증을 비싼 금고에 보관하는 꼴이라 파산합니다.
- 모든 데이터를 싼 아카이브 HDD(1TB당 2만 원)에 두면: 가성비는 최고지만, 오늘 올라온 인기 유튜브 영상을 로딩하는 데 10초가 걸려 고객이 다 떠납니다.
이 상충하는 요구를 해결하기 위해, 저장 공간을 3~4개의 계급(Tier)으로 나누는 계층화 전략이 도입되었습니다.
📢 섹션 요약 비유: 냉장고 정리와 같습니다. 오늘 내일 먹을 반찬(핫 데이터)은 손이 제일 잘 닿는 눈높이 칸(비싼 SSD)에 두고, 명절에나 한 번 먹는 음식(콜드 데이터)은 허리를 숙여야 하는 맨 밑바닥 냉동실 구석(값싼 HDD)에 쑤셔 박아 두는 것이 생활의 지혜입니다.
Ⅱ. 3단계 스토리지 티어 아키텍처
데이터센터의 스토리지 티어는 대개 0부터 3까지 번호를 매겨 구분합니다.
- Tier 0 (초고속/초고가): RAM, SCM(옵테인), 최상급 NVMe SSD. 주로 실시간 주식 거래, 게임 매칭 서버의 메모리(Hot Data)가 들어갑니다.
- Tier 1 (빠름/고가): 일반적인 엔터프라이즈 SAS SSD. 현재 활발하게 서비스 중인 쇼핑몰 이미지, 활성 데이터베이스(Warm Data)가 위치합니다.
- Tier 2 (느림/저가): 7200RPM 고용량 하드디스크(NL-SAS HDD). 1주일이 지나 조회 수가 꺾인 이메일이나 백업 파일, 파일 서버용으로 씁니다.
- Tier 3 (초저속/초저가): 자기 테이프(LTO Tape)나 클라우드 빙하(Glacier). 5년 동안 한 번도 안 열어볼 세금 영수증, 법적 보관 의무가 있는 감사 로그(Cold Data)를 산더미처럼 쌓아둡니다.
데이터의 자동 이사 (Auto-Tiering)
과거엔 관리자가 밤새워 스크립트를 돌려 데이터를 이사시켰지만, 지금은 EMC나 넷앱의 스토리지 하드웨어 칩이 알아서 합니다.
- "이 블록은 지난 3일간 한 번도 안 읽혔네? 강등(Demote)!" $\rightarrow$ 밤사이에 몰래 HDD(Tier 2)로 블록을 내립니다.
- "어? 3년 전 글인데 갑자기 오늘 역주행해서 100번 읽혔네? 승급(Promote)!" $\rightarrow$ HDD에 있던 데이터를 즉시 NVMe SSD(Tier 0)로 끌어올려 속도를 폭발시킵니다.
📢 섹션 요약 비유: 도서관 사서(컨트롤러 AI)가 책의 대출 빈도를 몰래 카운트합니다. 역주행한 옛날 책은 즉시 베스트셀러 진열대(Tier 0)로 옮겨주고, 1년간 아무도 안 빌려 간 책은 지하 먼지 쌓인 서고(Tier 3)로 귀양 보내서 책장 효율을 100%로 유지합니다.
Ⅲ. 클라우드 시대의 지능형 티어링
이 하드웨어적 기법은 클라우드 스토리지 서비스(AWS S3)에 그대로 녹아들었습니다. AWS S3의 'Intelligent-Tiering' 기능을 켜면, 클라우드가 내 파일의 접근 주기를 감시하다가, 한 달간 아무도 사진을 안 열어보면 자동으로 요금이 절반인 'S3 Infrequent Access' 티어로 파일을 내려버립니다.
아키텍트(설계자)는 더 이상 "어떤 디스크를 사야 할까?"를 고민할 필요 없이, 단일 저장소(Pool)를 만들어두고 티어링 정책(Policy)만 세팅해 두면 시스템이 알아서 성능과 비용을 최적화해 주는 자율주행 스토리지의 시대를 맞이했습니다.