126. 데이터 표준화 (단어·도메인·용어) - 전사 데이터 용어 통일 체계

핵심 인사이트 (3줄 요약)

본질: 데이터 표준화는 단어(Word)→도메인(Domain)→용어(Term)→컬럼명의 체계적 정의를 통해 전사 데이터의 명칭·형식·의미를 통일하는 활동이다.

가치: 같은 "고객번호"가 시스템마다 CUST_NO, CUSTOMER_ID, C_NUM 등 다르게 정의되면 데이터 통합·보고서 생성이 불가능하지만, 표준화하면 전사 일관된 데이터 모델이 보장된다.

판단 포인트: 단어(고객, 번호)→용어(고객번호)→물리명(CUST_NO)의 매핑 규칙을 정의하고, 데이터 사전(Data Dictionary)에서 관리한다.

Ⅰ. 개요 및 필요성

┌───────────────────────────────────────────────────────┐
│    데이터 표준화 체계                                 │
├───────────────────────────────────────────────────────┤
│  [단어(Word)]    고객, 번호, 일자, 금액, 코드        │
│  [도메인(Domain)] 번호=VARCHAR(10), 금액=DECIMAL(15,2)│
│  [용어(Term)]    고객번호 = 고객+번호 → CUST_NO      │
│                  주문일자 = 주문+일자 → ORD_DT        │
│  [컬럼명]        표준 용어의 물리명 자동 도출         │
│                                                       │
│  데이터 사전: 모든 표준 단어·도메인·용어 등록        │
└───────────────────────────────────────────────────────┘

📢 섹션 요약 비유: 데이터 표준화는 전국 도로의 표지판을 통일하는 것이다. 같은 도로가 지역마다 다른 이름이면 내비게이션(데이터 통합)이 불가능하다.

Ⅱ. 아키텍처 및 핵심 원리

단어·도메인·용어

구성	설명	예
단어	최소 의미 단위	고객, 번호
도메인	데이터 타입·길이·규칙	번호→VARCHAR(10)
용어	단어 조합의 비즈니스 의미	고객번호=고객+번호
물리명	용어의 영문 약어	CUST_NO

📢 섹션 요약 비유: 단어는 레고 블록, 용어는 블록을 조합한 완성품, 도메인은 블록의 크기·색상 규격이다.

Ⅲ. 비교 및 연결

비교	비표준	표준화
명칭	CUST_NO / C_NUM / 고객ID	CUST_NO (통일)
타입	시스템마다 다름	도메인 표준
통합	불가	가능

Ⅳ. 실무 적용 및 기술사 판단

데이터 표준화 절차

현행 분석: 기존 컬럼명 수집·분류.
단어 정의: 표준 단어 등록 (동의어·약어 정리).
도메인 정의: 타입·길이 규칙.
용어 정의: 단어 조합 → 물리명 매핑.
적용·검증: 모델링 도구와 연동.

Ⅴ. 기대효과 및 결론

데이터 표준화는 데이터 거버넌스·MDM·DW 구축의 기초이며, 표준 없는 데이터 통합은 모래 위의 건물이다.

📌 관련 개념 맵

개념	연결 포인트
단어	최소 의미 단위
도메인	데이터 타입·형식 규칙
용어	단어 조합의 비즈니스 명칭
데이터 사전	표준 관리 저장소
데이터 거버넌스	표준화의 상위 관리 체계

📈 관련 키워드 및 발전 흐름도

[비표준 (시스템별 독자 명칭, ~2000s)]
    │
    ▼
[데이터 표준화 (DA, 2005~) — 단어·도메인·용어]
    │
    ▼
[데이터 사전 시스템 (2010s)]
    │
    ▼
[데이터 카탈로그 + 표준 연동 (2018~)]
    │
    ▼
[현재: AI 표준 추천 — 자동 단어 매핑·동의어 식별]

👶 어린이를 위한 3줄 비유 설명

데이터 표준화는 전국 도로의 표지판을 통일하는 거예요.
같은 도로가 서울에서는 "1번 도로", 부산에서는 "A 도로"이면 내비가 혼란스러워요.
이름을 통일하면 어디서든 같은 이름으로 길을 찾을 수 있답니다!