65. 섀도우 데이터 (Shadow Data) - 통제받지 않은 클라우드 내 산재된 기업 민감 데이터

핵심 인사이트 (3줄 요약)

본질: 섀도우 데이터(Shadow Data)는 조직이 통제하지 못하는 클라우드 내 산재 데이터로, 민감정보 노출 위험이 크다.

가치: 데이터 위치, 소유자, 접근 권한, 보존 정책을 확인해야 섀도우 데이터를 줄일 수 있다.

판단: 섀도우 데이터는 섀도우 IT와 다르지만 연결되며, 클라우드 거버넌스의 핵심 리스크다.

Ⅰ. 개요 및 필요성

클라우드는 빠르게 저장하고 공유할 수 있게 해 주지만, 그만큼 통제되지 않은 데이터도 쉽게 늘어난다.

특히 민감정보가 여러 계정과 스토리지에 흩어지면 검색도 어렵고 삭제도 어렵다.

📢 섹션 요약 비유: 집 안 여기저기에 중요한 서류를 숨겨 두면 찾기도 어렵고 도난 위험도 커진다.

Ⅱ. 아키텍처 및 핵심 원리

Data Sources
  ↓
Cloud Storage / SaaS
  ↓
Discovery / Classification
  ↓
Access Control / Encryption
  ↓
Governance

위험 요인	설명
Uncontrolled Storage	승인 없는 저장소 사용
Sensitive Data Sprawl	민감정보 분산
Weak Access Control	과도한 권한
Retention Gap	보존/삭제 정책 부재

섀도우 데이터는 발견되지 않으면 보호할 수 없다. 따라서 발견(Discovery)과 분류(Classification)가 첫 단계다.

📢 섹션 요약 비유: 어디에 있는지 모르면 자물쇠를 채울 수도 없다.

Ⅲ. 비교 및 연결

개념	의미	차이
Shadow Data	통제 밖 민감 데이터	위치/권한 문제
Dark Data	활용되지 않는 데이터	가치 미활용 문제
Shadow IT	승인 없는 IT 사용	시스템/서비스 문제

대응 수단	역할
Data Discovery	숨은 데이터 탐지
DLP	유출 방지
Encryption	보호 강화
Lifecycle Policy	보존/삭제 관리

섀도우 데이터는 단순 저장 문제가 아니라 거버넌스 문제다. 저장소, 권한, 정책이 함께 관리되어야 한다.

📢 섹션 요약 비유: 숨은 보물과 다르게, 숨은 위험물은 먼저 찾아내야 한다.

Ⅳ. 실무 적용 및 기술사 판단

체크리스트

클라우드 자산과 데이터 위치를 모두 파악했는가?
민감도 분류와 태그가 적용되는가?
접근 권한이 최소화되어 있는가?
보존/삭제 정책이 자동화되어 있는가?
데이터 발견과 감사가 반복 가능한가?

안티패턴

계정과 버킷이 늘어나는데 데이터 목록이 없는 설계
민감정보를 일반 저장소에 방치하는 설계
권한 회수와 로그 점검을 하지 않는 설계
섀도우 IT와 섀도우 데이터를 같은 문제로만 보는 설계

기술사 관점에서는 섀도우 데이터를 "관리 안 되는 데이터"로 보고, 기술·조직·정책의 합산 리스크로 설명해야 한다.

📢 섹션 요약 비유: 창고가 많아질수록 열쇠와 목록표가 같이 늘어나야 한다.

Ⅴ. 기대효과 및 결론

섀도우 데이터를 줄이면 보안 사고 가능성이 줄고, 규정 준수와 삭제 대응도 쉬워진다. 결국 데이터 위치의 가시성이 핵심이다.

결론적으로 섀도우 데이터는 클라우드 시대의 대표적인 거버넌스 리스크다.

📢 섹션 요약 비유: 보이지 않는 곳에 둔 물건은 잃어버리기 쉽다.

어린이를 위한 3줄 비유 설명

중요한 서류를 여기저기 숨겨 두면 안 돼요.
어디 있는지 찾아내고, 잠그고, 목록을 적어야 해요.
섀도우 데이터는 그런 숨은 데이터를 말해요.