핵심 인사이트 (3줄 요약)
- 본질: 데이터 마트(Data Mart)는 데이터 웨어하우스(DW)로부터 특정 부서(마케팅, 재무 등)나 특정 주제의 사용자에게 최적화하여 추출한 소규모 데이터 저장소다.
- 가치: 전체 데이터를 뒤질 필요 없이 필요한 데이터만 모아두어 분석 속도가 매우 빠르며, 현업 부서의 요구사항에 민첩하게 대응할 수 있다.
- 판단 포인트: 랄프 킴벌(Ralph Kimball)의 상향식(Bottom-up) 방식은 전사 통합보다 부서별 마트 구축을 우선하여 빠른 가치 창출을 지향한다.
Ⅰ. 개요 및 필요성
거대한 전사 데이터 웨어하우스(DW)는 너무 방대해서 마케팅 담당자가 원하는 "지난달 쿠폰 사용 고객 리스트"를 찾는 데 시간이 오래 걸릴 수 있다. 데이터 마트(DM)는 특정 사용자가 자주 쓰는 데이터만 따로 떼어 '작은 상점'처럼 꾸려둔 것이다. 이를 통해 쿼리 성능을 높이고 사용자 편의성을 극대화한다. 특히 킴벌 방식은 전사 통합 모델을 기다리기보다 당장 필요한 부서의 마트부터 지어나가는 실용적인 접근법을 강조한다.
📢 섹션 요약 비유: 데이터 웨어하우스가 모든 물건이 다 있는 '대형 마트'라면, 데이터 마트는 우리 집 앞에 필요한 것만 골라놓은 '편의점'이나 '전문 정육점'과 같다.
Ⅱ. 아키텍처 및 핵심 원리
1. 킴벌(Kimball)의 아키텍처 (Bottom-up)
- 부서별로 필요한 데이터 마트를 먼저 구축한다.
- 이 마트들을 결합하여 전체 전사 데이터 웨어하우스를 완성해 나간다.
- 장점: 구축이 빠르고 ROI(투자 회수)가 즉각적임. 단점: 전사적 데이터 일관성이 깨질 위험(Data Island 현상)이 있음.
2. 다차원 모델링: 스타 스키마 (Star Schema)
분석 성능을 극대화하기 위해 데이터를 '사실'과 '차원'으로 나눈다.
- 팩트 테이블 (Fact Table): 수치 데이터(판매량, 금액 등)가 담긴 중앙 테이블.
- 차원 테이블 (Dimension Table): 수치를 설명하는 속성(시간, 장소, 상품명 등)이 담긴 주변 테이블.
- 모양이 별처럼 생겨서 '스타 스키마'라 부르며, 조인(Join)을 최소화해 속도가 매우 빠르다.
📢 섹션 요약 비유: 스타 스키마는 '피자'와 같다. 중앙의 도우(Fact) 위에 다양한 토핑(Dimension)이 올라가 하나의 맛있는 분석 정보를 완성하는 구조다.
Ⅲ. 비교 및 연결
빌 인몬(Inmon) vs 랄프 킴벌(Kimball)
| 비교 항목 | 빌 인몬 (Inmon) | 랄프 킴벌 (Kimball) |
|---|---|---|
| 접근 방식 | Top-down (전사 우선) | Bottom-up (부서 우선) |
| 데이터 구조 | 3정규형 (중복 최소화) | 다차원 모델링 (스타 스키마) |
| 구축 속도 | 느림 (전체를 다 설계해야 함) | 빠름 (필요한 곳부터 착수) |
| 데이터 통합성 | 매우 높음 (일관성 보장) | 낮음 (부서별로 숫자가 다를 수 있음) |
| 철학 | IT 주도의 견고한 인프라 | 현업 주도의 빠른 의사결정 지원 |
📢 섹션 요약 비유: 인몬은 '완벽한 백과사전 세트'를 다 사놓고 보는 것이고, 킴벌은 당장 필요한 '수학 참고서'와 '영어 잡지'부터 사서 공부하는 방식이다.
Ⅳ. 실무 적용 및 기술사 판단
기술사 핵심 포인트:
- 버스 아키텍처 (Bus Architecture): 킴벌 방식의 단점인 데이터 파편화를 막기 위해, 부서별로 다른 마트여도 공통적으로 쓰는 차원(예: 날짜, 고객번호)은 동일하게 맞추는 'Conformed Dimension' 전략이 중요하다.
- 비정규화 (Denormalization): DW/DM은 저장 공간보다 조회 성능이 우선이므로 고의로 데이터를 중복시키는 비정규화 전략을 사용한다.
- OLAP 연동: 데이터 마트는 주로 OLAP 툴과 연결되어 드릴다운(Drill-down) 등의 다차원 분석 도구로 활용된다.
📢 섹션 요약 비유: 데이터 마트는 분석의 '전진기지'다. 본진(DW)에서 보급을 받아 현장에서 즉시 전략을 짤 수 있게 돕는 실무 중심의 저장소다.
Ⅴ. 기대효과 및 결론
데이터 마트는 현업 사용자가 데이터에 쉽게 접근하고 빠르게 결론을 내릴 수 있게 하는 SaaS 및 BI 환경의 필수 요소다. 전사 통합(Inmon)의 이상과 부서별 민첩성(Kimball)의 실용 사이에서 균형을 잡는 것이 데이터 아키텍트의 역량이다. 최근에는 기술 발달로 물리적 마트 대신 가상 마트(Virtual Mart)를 구축하기도 한다.
📢 섹션 요약 비유: 데이터 마트는 부서별 '맞춤 도시락'이다. 대규모 뷔페(DW)에 갈 필요 없이 내 입맛에 맞는 반찬만 쏙쏙 골라 담아 빠르게 배를 채울 수 있게 해준다.
📌 관련 개념 맵
| 개념 | 연관 키워드 | 관계 |
|---|---|---|
| Fact Table | 측정값, FK들의 집합 | 분석의 대상이 되는 수치 데이터 |
| Dimension Table | 속성, 맥락 정보 | 숫자를 설명해주는 배경 정보 (누가, 언제) |
| Star Schema | 비정규화, 빠른 조인 | 킴벌이 제안한 분석 전용 데이터 구조 |
| Data Island | 데이터 파편화, 불일치 | 마트별로 데이터가 따로 놀아 생기는 부작용 |
👶 어린이를 위한 3줄 비유 설명
- 거대한 도서관에서 내가 공부할 때 필요한 책들만 따로 모아둔 내 전용 책상이에요.
- 찾기 아주 쉽게 별 모양(스타 스키마)으로 예쁘게 정리해두었답니다.
- 우리 반 친구들만 쓰는 전용 정보함 같은 거라서 대답이 아주 빨라요.