360. 데이터 가상화 (Data Virtualization)
핵심 인사이트 (3줄 요약)
- 데이터를 중앙 복사본 창고(DW)에 밀어 넣고 스케줄을 기다려야 하는 T+1 지연 시간을 부수고, 데이터 원천(Source)에 실시간으로 실시간 연방 쿼리(Federated Query) 를 날린다.
- 민감한 정보(주민번호 등)를 여러 서버로 복사/적재에 따르는 심각한 정보보호 유출 복제 리스크를 단번에 해결하는 보안 아키텍처이기도 하다.
- 네트워크 대역폭 제한으로 인한 대용량 집계 쿼리의 극심한 병목이 치명적 한계이나, 캐싱 레이어와 쿼리 푸시다운(Push-down) 트릭을 통해 보정된다.
Ⅰ. 아키텍처 및 원리
[ 복사 구조(ETL) ] : DB1, DB2 ----(주기적 복사/중복적재)----> 중앙 DW
[ 가상화 뷰 연방 ] : BI Tool ---> [ 논리 뷰 레이어 ] ==실시간 분배통신==> DB1, DB2 (복사X)
Ⅱ. 실무 적용 및 결론
모든 데이터를 다 한곳에 모으기엔 스토리지 비용이 비싸거나 법적(컴플라이언스 국외 반출 불가) 이슈가 걸린 글로벌 법인 통합 대시보드 화면을 띄울 때 가장 무결하고 현명한 차선책으로 작동한다.