핵심 인사이트 (3줄 요약)
- 본질: 데이터 표준화는 단어(Word)→도메인(Domain)→용어(Term)→컬럼명의 체계적 정의를 통해 전사 데이터의 명칭·형식·의미를 통일하는 활동이다.
- 가치: 같은 "고객번호"가 시스템마다 CUST_NO, CUSTOMER_ID, C_NUM 등 다르게 정의되면 데이터 통합·보고서 생성이 불가능하지만, 표준화하면 전사 일관된 데이터 모델이 보장된다.
- 판단 포인트: 단어(고객, 번호)→용어(고객번호)→물리명(CUST_NO)의 매핑 규칙을 정의하고, 데이터 사전(Data Dictionary)에서 관리한다.
Ⅰ. 개요 및 필요성
┌───────────────────────────────────────────────────────┐
│ 데이터 표준화 체계 │
├───────────────────────────────────────────────────────┤
│ [단어(Word)] 고객, 번호, 일자, 금액, 코드 │
│ [도메인(Domain)] 번호=VARCHAR(10), 금액=DECIMAL(15,2)│
│ [용어(Term)] 고객번호 = 고객+번호 → CUST_NO │
│ 주문일자 = 주문+일자 → ORD_DT │
│ [컬럼명] 표준 용어의 물리명 자동 도출 │
│ │
│ 데이터 사전: 모든 표준 단어·도메인·용어 등록 │
└───────────────────────────────────────────────────────┘
- 📢 섹션 요약 비유: 데이터 표준화는 전국 도로의 표지판을 통일하는 것이다. 같은 도로가 지역마다 다른 이름이면 내비게이션(데이터 통합)이 불가능하다.
Ⅱ. 아키텍처 및 핵심 원리
단어·도메인·용어
| 구성 | 설명 | 예 |
| 단어 | 최소 의미 단위 | 고객, 번호 |
| 도메인 | 데이터 타입·길이·규칙 | 번호→VARCHAR(10) |
| 용어 | 단어 조합의 비즈니스 의미 | 고객번호=고객+번호 |
| 물리명 | 용어의 영문 약어 | CUST_NO |
- 📢 섹션 요약 비유: 단어는 레고 블록, 용어는 블록을 조합한 완성품, 도메인은 블록의 크기·색상 규격이다.
Ⅲ. 비교 및 연결
| 비교 | 비표준 | 표준화 |
| 명칭 | CUST_NO / C_NUM / 고객ID | CUST_NO (통일) |
| 타입 | 시스템마다 다름 | 도메인 표준 |
| 통합 | 불가 | 가능 |
Ⅳ. 실무 적용 및 기술사 판단
데이터 표준화 절차
- 현행 분석: 기존 컬럼명 수집·분류.
- 단어 정의: 표준 단어 등록 (동의어·약어 정리).
- 도메인 정의: 타입·길이 규칙.
- 용어 정의: 단어 조합 → 물리명 매핑.
- 적용·검증: 모델링 도구와 연동.
Ⅴ. 기대효과 및 결론
데이터 표준화는 데이터 거버넌스·MDM·DW 구축의 기초이며, 표준 없는 데이터 통합은 모래 위의 건물이다.
📌 관련 개념 맵
| 개념 | 연결 포인트 |
| 단어 | 최소 의미 단위 |
| 도메인 | 데이터 타입·형식 규칙 |
| 용어 | 단어 조합의 비즈니스 명칭 |
| 데이터 사전 | 표준 관리 저장소 |
| 데이터 거버넌스 | 표준화의 상위 관리 체계 |
📈 관련 키워드 및 발전 흐름도
[비표준 (시스템별 독자 명칭, ~2000s)]
│
▼
[데이터 표준화 (DA, 2005~) — 단어·도메인·용어]
│
▼
[데이터 사전 시스템 (2010s)]
│
▼
[데이터 카탈로그 + 표준 연동 (2018~)]
│
▼
[현재: AI 표준 추천 — 자동 단어 매핑·동의어 식별]
👶 어린이를 위한 3줄 비유 설명
- 데이터 표준화는 전국 도로의 표지판을 통일하는 거예요.
- 같은 도로가 서울에서는 "1번 도로", 부산에서는 "A 도로"이면 내비가 혼란스러워요.
- 이름을 통일하면 어디서든 같은 이름으로 길을 찾을 수 있답니다!