💡 핵심 인사이트
데이터 표준화(Data Standardization)는 회사 내 수백 명의 개발자가 각자 자기 마음대로 DB 테이블과 컬럼 이름을 지어대며 콩글리시와 약어를 남발하는 끔찍한 개판을 막기 위해, '전사 공통 단어 사전'과 '작명(Naming) 법전'을 만들어 "앞으로 컬럼 이름은 무조건 이 규칙대로만 지어라!"라고 족쇄를 채우는 데이터베이스 통일 작업입니다.


Ⅰ. 표준화가 없는 DB의 끔찍한 참상 (바벨탑의 저주)

  • A 개발자 (영업팀): 고객 테이블을 만들면서 고객 이름을 CUST_NAME, 타입은 VARCHAR(20)으로 만들었습니다.
  • B 개발자 (마케팅팀): 이벤트 테이블을 짜면서 고객 이름을 USER_NM, 타입은 CHAR(30)으로 만들었습니다.
  • C 개발자 (회계팀): 청구서 테이블에 고객 이름을 그냥 한글 발음대로 GOGEK_IRUM이라고 지었습니다.

재앙의 결과: 나중에 이 세 개의 테이블을 조인(Join)하려니 이름도 제각각이고(가독성 폭망), 크기가 20과 30으로 달라서 데이터가 짤리거나 DB 엔진이 강제 형 변환(Casting)을 하느라 조인 속도가 지옥으로 떨어집니다. 이 바벨탑의 저주를 막기 위해 데이터 아키텍트(DA)가 칼을 빼 드는 것이 데이터 표준화입니다.


Ⅱ. 데이터 표준화의 3대 핵심 뼈대

DBA는 테이블 설계(ERD) 전에 이 3가지 헌법부터 쾅쾅 박아놓고 시작해야 합니다.

1. 표준 단어 사전 (Standard Word Dictionary)

  • 기업에서 쓰는 모든 명사를 최소 단위로 쪼개어 영문 약어(Abbreviation) 맵핑표를 만듭니다.
  • 규칙: "고객 = CUST, 번호 = NO, 금액 = AMT, 일자 = DT"
  • 개발자는 절대 마음대로 약어를 창조할 수 없으며, 무조건 이 사전에 등재된 단어만 조립해야 합니다.

2. 표준 도메인 사전 (Standard Domain Dictionary)

  • 컬럼 이름 끝에 붙는 꼬리표(분류어)에 따라 **데이터 타입(Type)과 길이(Length)**를 강제로 통일시켜 버립니다.
  • 규정 예시:
    • 끝 단어가 _NO(번호)로 끝나는 모든 컬럼은 무조건 VARCHAR(10)으로 통일해라!
    • 끝 단어가 _AMT(금액)로 끝나는 모든 컬럼은 무조건 NUMBER(15,2)로 통일해라!
  • 효과: 조인(Join)할 때 데이터 타입 불일치로 인한 성능 저하(오버헤드)가 100% 원천 차단됩니다.

3. 표준 용어 사전 (Standard Term Dictionary) ★최종 완성

  • 1번의 '표준 단어'들과 2번의 '도메인'을 레고 블록처럼 결합하여, 최종적으로 DB 테이블에 들어갈 진짜 컬럼 이름(물리명)을 찍어내는 사전입니다.
  • 조립 예시:
    • (단어: 고객=CUST) + (단어: 번호=NO) ➔ 최종 표준 용어: CUST_NO
    • CUST_NO의 데이터 타입은? 도메인 사전에 의해 자동으로 VARCHAR(10)이 부여됩니다.

Ⅲ. 데이터 표준화의 위대한 효과

  • 가독성 극대화: 신입 개발자가 처음 회사에 와서 DB 스키마를 켜도, CUST_ORD_DT라는 컬럼을 보는 순간 "아, 이건 고객(CUST) 주문(ORD) 일자(DT)구나. 날짜 타입이겠네"라고 1초 만에 찰떡같이 해독할 수 있습니다.
  • 유지보수 비용 제로: 이름이 통일되어 있으므로, 나중에 회사의 모든 테이블에서 고객 관련 컬럼만 검색해서 찾아내는 유지보수 작업이 마우스 클릭 몇 번으로 끝납니다.

📢 섹션 요약 비유: 데이터 표준화가 없는 DB는 사람들이 **'제멋대로 재료를 부르는 무법지대 주방'**입니다. A는 '파', B는 '대파', C는 '녹색 채소'라고 주문을 써넣어 요리사가 미쳐버립니다. 데이터 표준화는 주방장이 "앞으로 모든 레시피에는 무조건 '대파 50g'이라는 통일된 표준 용어(규격)만 써라!"라고 엄격한 표기법 헌법을 세워, 주방의 의사소통 속도와 재료 관리 효율을 극강으로 끌어올리는 위대한 군기 잡기입니다.