데이터 품질 (Data Quality), 라인리지 (Lineage), 데이터 카탈로그 (Data Catalog)
출제 빈도: ★★★★☆ | 난이도: ★★★☆☆
답안.
Ⅰ. 개요
데이터 품질은 정확성, 완전성, 일관성, 적시성 등 데이터가 사용 목적에 부합하는 수준을 의미한다.
라인리지는 데이터가 어디서 왔고 어떤 변환을 거쳐 어디로 소비되는지 추적하는 계보 정보다.
데이터 카탈로그는 메타데이터와 소유자, 용어, 사용 방법을 정리해 데이터 탐색성과 거버넌스를 높이는 체계다.
Ⅱ. 핵심 구성요소
Ⅰ. 개요
1. 정의
2. 데이터 신뢰성과 규제 대응 요구 확대
Ⅱ. 핵심 구성요소
1. 품질 관리 개념
2. 계보와 메타데이터 운영
Ⅲ. 특징 및 장단점
1. 데이터 신뢰도와 탐색성 향상
2. 도구만 도입하고 운영 책임이 없으면 실패
Ⅳ. 유사 기술과의 비교
- 데이터 품질 vs 라인리지 vs 데이터 카탈로그 비교표
Ⅴ. 적용사례 및 향후전망
1. 데이터 거버넌스와 규제 대응 플랫폼 구축
2. Active metadata와 데이터 관측성 도구 발전
해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.
Ⅲ. 특징 및 비교
핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.
Ⅳ. 적용 사례
실무 환경에서의 적용 사례와 기대효과를 제시한다.
Ⅴ. 전망
최신 기술 동향과 향후 발전 방향을 서술한다.