💡 핵심 인사이트
데이터베이스 아키텍처 관점에서 마스터 데이터 관리(MDM)는, 수십 개의 파편화된 시스템(ERP, CRM, 쇼핑몰 DB)에 흩어져 있는 핵심 데이터(고객, 상품, 부서)의 멱살을 잡아끌고 와, 유일무이하고 완벽하게 정제된 하나의 '황금 원본(Golden Record) DB 테이블'을 구축하여 전사 시스템에 배포하는 거버넌스 기술입니다.
Ⅰ. DB 관리자(DBA)를 미치게 하는 데이터 파편화
회사가 커지면 사내에 DB 서버가 수십 대 생깁니다.
- 영업팀 DB:
고객명: 김철수, 주소: 강남구, 등급: VIP - 콜센터 DB:
고객명: 김철수, 주소: 서초구(옛날주소), 포인트: 500
[문제점]
"진짜 김철수 주소가 뭐야?"
DBA가 두 DB를 조인(JOIN)해서 통계를 내려고 해도, 어느 테이블의 데이터가 최신이고 팩트(Fact)인지 알 수가 없습니다. (Single Source of Truth의 상실).
이대로 데이터 웨어하우스(DW)에 부어버리면 쓰레기 통계가 나옵니다.
Ⅱ. MDM(마스터 데이터 관리) 아키텍처 구축
이 난장판을 끝내기 위해 DBA와 데이터 아키텍트가 도입하는 솔루션이 MDM 허브(Hub)입니다.
1. 통합 및 정제 (Cleansing & Matching)
- 각 부서의 10개 DB에서 매일 밤 '고객 데이터'를 MDM 중앙 서버로 싹 다 긁어모읍니다 (ETL 연동).
- 긁어모은 데이터에서 오타를 지우고, 이름과 전화번호가 같으면 중복된 데이터(Duplicate)로 판단하여 하나로 합치는 매칭(Matching) 알고리즘을 빡세게 돌립니다.
2. 골든 레코드 (Golden Record) 생성 ★
- 정제가 끝난 후, "이 강남구에 사는 김철수 데이터가 우리 회사가 인정하는 100% 무결점 정답이다!"라고 도장을 찍어 **가장 신뢰할 수 있는 단 하나의 마스터 테이블의 행(Row)**으로 확정 짓습니다. 이를 골든 레코드라 부릅니다.
3. 동기화 및 배포 (Synchronization)
- 이제 영업팀이나 콜센터 직원이 자기들 맘대로 엑셀을 고치게 두지 않습니다.
- MDM 중앙 서버가 완성된 골든 레코드를 각 부서의 DB로 실시간으로(또는 배치로) 쫙 뿌려주어, 전사의 모든 DB가 완벽하게 똑같은 '김철수' 데이터를 갖도록 강제 동기화시킵니다.
Ⅲ. 트랜잭션 데이터와의 구분
DB를 설계할 때 이 두 개를 헷갈리면 안 됩니다.
- 마스터 데이터 (Master Data): 잘 변하지 않는 명사 뼈대. (고객 정보, 상품 코드, 계정과목). ➔ 이걸 통합 관리하는 게 MDM.
- 트랜잭션 데이터 (Transaction Data): 매일 수만 건씩 쏟아지는 동적인 사건 기록. (주문 내역, 입금 영수증, 홈페이지 로그인 로그). ➔ 이건 MDM 대상이 아니라 데이터 웨어하우스(DW) 저장 대상.
📢 섹션 요약 비유: MDM은 족보가 꼬인 대가족의 **'종갓집 호적 정리'**입니다. 첫째 아들은 수첩에, 둘째 딸은 폰 메모장에 제각각 할아버지 제사 날짜(데이터)를 다르게 적어놓고 싸웁니다. 이때 종갓집 어르신(MDM)이 나서서 낡은 족보들을 다 수거한 뒤 팩트 체크를 하여 '완벽한 최신 공식 족보(골든 레코드)' 딱 한 권을 새로 찍어내어 모든 자식들에게 똑같이 나눠주고 강제로 외우게 만드는 무결성 확보 작업입니다.