핵심 인사이트 (3줄 요약)

  1. 본질: 차원 모델링은 데이터 웨어하우스(DW)에서 분석 쿼리 성능을 극대화하기 위해, 데이터를 **팩트 테이블(측정값)과 디멘전 테이블(분석 축)**로 구성하는 설계 기법이다.
  2. 가치: 3NF 정규화는 OLTP에 최적이지만, 분석 쿼리(GROUP BY·SUM·AVG)에는 JOIN이 과다하여 느리다. 차원 모델링은 비정규화된 디멘전으로 JOIN을 최소화하여 쿼리 속도를 10~100배 향상시킨다.
  3. 판단 포인트: **스타 스키마(팩트 중심 1단계 JOIN)**와 **스노우플레이크 스키마(디멘전 정규화, 다단계 JOIN)**를 구분하고, 현대 컬럼 스토어(BigQuery·Snowflake)에서는 스타 스키마가 사실상 표준이다.

Ⅰ. 개요 및 필요성

┌───────────────────────────────────────────────────────┐
│    스타 스키마 구조                                    │
├───────────────────────────────────────────────────────┤
│        [DIM_날짜]                                     │
│            │                                          │
│  [DIM_상품]──[FACT_매출]──[DIM_고객]                  │
│            │                                          │
│        [DIM_매장]                                     │
│                                                       │
│  FACT_매출: 날짜KEY, 상품KEY, 고객KEY, 매장KEY,       │
│            매출액, 수량, 할인액 (측정값)               │
│  DIM_상품: 상품KEY, 상품명, 카테고리, 브랜드 (분석 축)│
└───────────────────────────────────────────────────────┘
  • 📢 섹션 요약 비유: 팩트 테이블은 "무엇이 일어났는가(매출 3만원)"를 기록하고, 디멘전 테이블은 "어디서, 언제, 누가, 무엇을(분석 축)"을 설명한다.

Ⅱ. 아키텍처 및 핵심 원리

팩트 vs 디멘전

구분팩트 테이블디멘전 테이블
내용측정값 (매출, 수량)분석 축 (날짜, 상품, 고객)
행 수매우 많음 (수억)적음 (수천~수만)
FK (디멘전 참조)PK (Surrogate Key)
변경추가만 (Append)SCD (Slowly Changing)

스타 vs 스노우플레이크

비교스타 스키마스노우플레이크
디멘전비정규화 (1테이블)정규화 (다단계)
JOIN1단계다단계
쿼리 속도빠름느림
중복있음최소
현대 DW표준드물게 사용
  • 📢 섹션 요약 비유: 스타 스키마는 백화점 안내판(한 곳에 모든 정보)이고, 스노우플레이크는 안내판→층별 안내→매장별 안내로 나뉜 체계다.

Ⅲ. 비교 및 연결

비교3NF (OLTP)스타 스키마 (OLAP)
목적트랜잭션 무결성분석 쿼리 성능
JOIN많음최소
중복없음허용

Ⅳ. 실무 적용 및 기술사 판단

SCD (Slowly Changing Dimension)

  • Type 1: 덮어쓰기 (이력 없음).
  • Type 2: 새 행 추가 (이력 보존, 유효 기간).
  • Type 3: 이전/현재 값 컬럼 (제한된 이력).

Ⅴ. 기대효과 및 결론

지표3NF 분석스타 스키마개선
쿼리 속도느림 (다단 JOIN)빠름 (1단 JOIN)10~100×
사용자 이해어려움직관적셀프 서비스 BI

차원 모델링은 Kimball 방법론의 핵심이며, 현대 클라우드 DW(BigQuery, Snowflake)에서도 스타 스키마가 표준으로 사용된다.


📌 관련 개념 맵

개념연결 포인트
팩트 테이블측정값(매출·수량) 저장
디멘전 테이블분석 축(날짜·상품·고객)
스타 스키마팩트 중심 1단계 JOIN
SCD디멘전 변경 이력 관리
Kimball 방법론차원 모델링의 이론적 기반

📈 관련 키워드 및 발전 흐름도

[ER 모델 3NF (OLTP, 1970s)]
    │
    ▼
[Kimball 차원 모델링 (1996) — 스타 스키마·팩트/디멘전]
    │
    ▼
[스노우플레이크 스키마 (디멘전 정규화 변형)]
    │
    ▼
[컬럼 스토어 DW (BigQuery, 2010s) — 스타 스키마 최적]
    │
    ▼
[현재: dbt + 스타 스키마 — 분석 엔지니어링 자동화]

👶 어린이를 위한 3줄 비유 설명

  1. 팩트 테이블은 "가게에서 무엇이 일어났는지(매출 3만원)"를 기록하는 일지예요.
  2. 디멘전 테이블은 "어디서, 언제, 누가 샀는지"를 설명하는 사전이에요.
  3. 스타 스키마는 일지와 사전을 별(Star) 모양으로 연결해서 빠르게 분석할 수 있게 한 거예요!