데이터 패브릭, 데이터 메시, 데이터 민주화, 분산 소유권
출제 빈도: ★★★★★ | 기출: ★135회 (데이터 거버넌스 핵심 트렌드)
답안.
Ⅰ. 개요
데이터 패브릭(Data Fabric): 이기종 데이터 소스를 통합된 메타데이터와 자동화로 연결하는 데이터 관리 아키텍처. 중앙 집중식. 데이터 메시(Data Mesh): 데이터를 도메인별로 분산 소유하고 각 도메인이 데이터 제품을 책임지는 분산 아키텍처. 탈중앙화.
Ⅱ. 핵심 구성요소
I. 데이터 거버넌스의 발전
데이터 웨어하우스 → 데이터 레이크 → 레이크하우스 → 패브릭/메시
기존 문제: 중앙 데이터팀 병목, 데이터 사일로, 느린 분석
II. 데이터 패브릭 (Data Fabric)
[데이터 패브릭 아키텍처]
다양한 소스 (온프레미스, 클라우드, SaaS)
↓ 자동 메타데이터 수집
통합 메타데이터 레이어 (지식 그래프)
↓ AI 기반 데이터 발견·연결
통합 데이터 접근 레이어
↓
분석, AI/ML, 리포팅
핵심 기능:
- 메타데이터 자동 수집 및 카탈로그
- AI 추천: "이 데이터를 찾으세요"
- 데이터 계보(Lineage) 자동 추적
- 구현: IBM Cloud Pak, AWS Lake Formation, Azure Purview
III. 데이터 메시 (Data Mesh) — Zhamak Dehghani 제안
4가지 원칙:
1. 도메인 지향 분산 소유권
- 각 도메인(결제팀, 물류팀)이 자신의 데이터 소유
- "데이터 제품(Data Product)" 개념
해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.
### Ⅲ. 특징 및 비교
핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.
### Ⅳ. 적용 사례
실무 환경에서의 적용 사례와 기대효과를 제시한다.
### Ⅴ. 전망
최신 기술 동향과 향후 발전 방향을 서술한다.