데이터 레이크하우스 (Lakehouse)
별점: ★★★★★ | ☆ 2026 확실 예측
답안.
Ⅰ. 개요
데이터 웨어하우스(DW) → 데이터 레이크 → 레이크하우스
- 정형 데이터만, 고비용, 비정형 미지원
- 스키마 없음, 품질 보장 안됨, "데이터 늪"
Ⅱ. 핵심 구성요소
데이터 웨어하우스(DW) → 데이터 레이크 → 레이크하우스
[데이터 웨어하우스 문제]
- 정형 데이터만, 고비용, 비정형 미지원
[데이터 레이크 문제]
- 스키마 없음, 품질 보장 안됨, "데이터 늪"
- ACID 없음 → 동시 쓰기 시 데이터 불일치
[레이크하우스 해결]
데이터 레이크 위에 DW 기능(ACID, 스키마, 성능) 추가
= 레이크의 유연성 + DW의 신뢰성
[Delta Lake 핵심 기능]
타임트래블: 과거 데이터 버전 조회 가능
SELECT * FROM table TIMESTAMP AS OF '2024-01-01'
ACID 트랜잭션:
- 원자적 쓰기 (부분 실패 없음)
- 낙관적 동시성 제어
- 롤백 가능
스키마 강제(Schema Enforcement) + 진화(Evolution)
[레이크하우스 계층]
저장: 클라우드 오브젝트 스토리지 (S3, ADLS)
메타데이터: Delta/Iceberg 트랜잭션 로그
해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.
### Ⅲ. 특징 및 비교
핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.
### Ⅳ. 적용 사례
실무 환경에서의 적용 사례와 기대효과를 제시한다.
### Ⅴ. 전망
최신 기술 동향과 향후 발전 방향을 서술한다.