핵심 인사이트 (3줄 요약)

  1. 본질: 데이터 표준화는 단어(Word)→도메인(Domain)→용어(Term)→컬럼명의 체계적 정의를 통해 전사 데이터의 명칭·형식·의미를 통일하는 활동이다.
  2. 가치: 같은 "고객번호"가 시스템마다 CUST_NO, CUSTOMER_ID, C_NUM 등 다르게 정의되면 데이터 통합·보고서 생성이 불가능하지만, 표준화하면 전사 일관된 데이터 모델이 보장된다.
  3. 판단 포인트: 단어(고객, 번호)→용어(고객번호)→물리명(CUST_NO)의 매핑 규칙을 정의하고, 데이터 사전(Data Dictionary)에서 관리한다.

Ⅰ. 개요 및 필요성

┌───────────────────────────────────────────────────────┐
│    데이터 표준화 체계                                 │
├───────────────────────────────────────────────────────┤
│  [단어(Word)]    고객, 번호, 일자, 금액, 코드        │
│  [도메인(Domain)] 번호=VARCHAR(10), 금액=DECIMAL(15,2)│
│  [용어(Term)]    고객번호 = 고객+번호 → CUST_NO      │
│                  주문일자 = 주문+일자 → ORD_DT        │
│  [컬럼명]        표준 용어의 물리명 자동 도출         │
│                                                       │
│  데이터 사전: 모든 표준 단어·도메인·용어 등록        │
└───────────────────────────────────────────────────────┘
  • 📢 섹션 요약 비유: 데이터 표준화는 전국 도로의 표지판을 통일하는 것이다. 같은 도로가 지역마다 다른 이름이면 내비게이션(데이터 통합)이 불가능하다.

Ⅱ. 아키텍처 및 핵심 원리

단어·도메인·용어

구성설명
단어최소 의미 단위고객, 번호
도메인데이터 타입·길이·규칙번호→VARCHAR(10)
용어단어 조합의 비즈니스 의미고객번호=고객+번호
물리명용어의 영문 약어CUST_NO
  • 📢 섹션 요약 비유: 단어는 레고 블록, 용어는 블록을 조합한 완성품, 도메인은 블록의 크기·색상 규격이다.

Ⅲ. 비교 및 연결

비교비표준표준화
명칭CUST_NO / C_NUM / 고객IDCUST_NO (통일)
타입시스템마다 다름도메인 표준
통합불가가능

Ⅳ. 실무 적용 및 기술사 판단

데이터 표준화 절차

  1. 현행 분석: 기존 컬럼명 수집·분류.
  2. 단어 정의: 표준 단어 등록 (동의어·약어 정리).
  3. 도메인 정의: 타입·길이 규칙.
  4. 용어 정의: 단어 조합 → 물리명 매핑.
  5. 적용·검증: 모델링 도구와 연동.

Ⅴ. 기대효과 및 결론

데이터 표준화는 데이터 거버넌스·MDM·DW 구축의 기초이며, 표준 없는 데이터 통합은 모래 위의 건물이다.


📌 관련 개념 맵

개념연결 포인트
단어최소 의미 단위
도메인데이터 타입·형식 규칙
용어단어 조합의 비즈니스 명칭
데이터 사전표준 관리 저장소
데이터 거버넌스표준화의 상위 관리 체계

📈 관련 키워드 및 발전 흐름도

[비표준 (시스템별 독자 명칭, ~2000s)]
    │
    ▼
[데이터 표준화 (DA, 2005~) — 단어·도메인·용어]
    │
    ▼
[데이터 사전 시스템 (2010s)]
    │
    ▼
[데이터 카탈로그 + 표준 연동 (2018~)]
    │
    ▼
[현재: AI 표준 추천 — 자동 단어 매핑·동의어 식별]

👶 어린이를 위한 3줄 비유 설명

  1. 데이터 표준화는 전국 도로의 표지판을 통일하는 거예요.
  2. 같은 도로가 서울에서는 "1번 도로", 부산에서는 "A 도로"이면 내비가 혼란스러워요.
  3. 이름을 통일하면 어디서든 같은 이름으로 길을 찾을 수 있답니다!