29. 파일 시스템의 문제점 (File System Problems)

핵심 인사이트 (3줄 요약)

본질: 데이터베이스 이전 시대의 파일 시스템 기반 데이터 관리는 데이터 종속성, 데이터 중복, 무결성 부재, 동시성 제어 불가, 보안 취약이라는 5대 문제를 구조적으로 가지고 있었다. DBMS는 이를 해결하기 위해 탄생했다.

가치: 파일 시스템 문제를 이해하면 DBMS가 제공하는 추상화 레이어(데이터 독립성, 트랜잭션, 무결성, 접근 제어)의 가치가 명확해진다. 현대 마이크로서비스에서도 서비스별 로컬 파일 저장은 동일한 문제를 반복한다.

판단 포인트: 파일 시스템 문제가 현대에도 반복되는 패턴이 있다. NoSQL DB를 파일 시스템처럼 사용하거나, 마이크로서비스가 로컬 파일에 의존하거나, CSV 파일로 데이터를 교환하는 패턴에서 동일한 중복·불일치·무결성 문제가 재발한다.

Ⅰ. 개요 및 필요성

┌──────────────────────────────────────────────────────────┐
│         파일 시스템 5대 문제                               │
├──────────────────────────────────────────────────────────┤
│  1. 데이터 중복성 (Data Redundancy)                       │
│     → 같은 고객 정보가 주문파일·배송파일·결제파일에 반복  │
│                                                           │
│  2. 데이터 불일치 (Data Inconsistency)                    │
│     → 한 파일 고객 주소 변경 시 다른 파일은 미반영        │
│                                                           │
│  3. 데이터 종속성 (Data Dependency)                       │
│     → 파일 구조 변경 시 모든 프로그램 수정 필요           │
│                                                           │
│  4. 무결성 제약 없음 (No Integrity Constraints)           │
│     → 잘못된 값(음수 나이, 존재하지 않는 외래 키) 저장 가능│
│                                                           │
│  5. 동시성·보안 부재 (No Concurrency/Security)           │
│     → 여러 사용자 동시 수정 → 데이터 손상                │
└──────────────────────────────────────────────────────────┘

📢 섹션 요약 비유: 파일 시스템 문제는 포스트잇 관리 방식이다. 각 부서가 각자 포스트잇(파일)에 고객 정보를 적으면 중복·불일치·분실이 발생한다. DB는 모든 부서가 공유하는 화이트보드(중앙 관리)다.

Ⅱ. 아키텍처 및 핵심 원리

DBMS가 제공하는 해결책

파일 시스템 문제	DBMS 해결책
데이터 중복	정규화(Normalization), 단일 진실 소스
데이터 불일치	트랜잭션 ACID, 무결성 제약
데이터 종속성	물리적·논리적 데이터 독립성
무결성 부재	도메인·참조·개체 무결성 제약
동시성 부재	락(Lock), MVCC, 트랜잭션 격리
보안 부재	뷰, GRANT/REVOKE, 역할 기반 접근 제어

데이터 독립성

물리적 독립성: 저장 구조 변경 → 논리 스키마 불변
  (예: HDD → SSD 마이그레이션, 파티셔닝)

논리적 독립성: 논리 스키마 변경 → 응용 프로그램 불변
  (예: 테이블 컬럼 추가 시 기존 앱 수정 불필요)

📢 섹션 요약 비유: 데이터 독립성은 건물 리모델링과 같다. 건물 내부(물리 저장)를 바꿔도 주소(논리 스키마)는 유지되고, 방 배치(논리 스키마)를 바꿔도 입주자(앱)는 계속 거주한다.

Ⅲ. 비교 및 연결

비교	파일 시스템	RDBMS
데이터 중복	높음	정규화로 최소화
무결성	앱 담당	DB 레벨 보장
동시성	미지원	트랜잭션·락
독립성	낮음	3-Level 스키마
표준 쿼리	없음	SQL 표준

📢 섹션 요약 비유: 파일 시스템 vs DBMS는 개인 노트 vs 공유 협업 도구다. 개인 노트(파일)는 편하지만 공유하면 혼란이 생기고, 협업 도구(DB)는 모두가 최신 정보를 공유하며 충돌을 자동으로 해결한다.

Ⅳ. 실무 적용 및 기술사 판단

현대에도 반복되는 파일 시스템 문제 패턴

마이크로서비스 로컬 파일 저장:
  서비스 A: /data/users.json
  서비스 B: /data/users.json (별도 복사본)
  → 중복·불일치 재발 → 이벤트 소싱/공유 DB 필요

CSV 기반 데이터 교환:
  각 팀이 Excel/CSV로 데이터 공유
  → 버전 불일치, 무결성 미보장
  → 데이터 허브/API 기반 교환으로 전환 필요

로그 파일 기반 상태 관리:
  앱 상태를 로그 파일에 저장
  → 동시 접근 충돌, 일관성 보장 불가

📢 섹션 요약 비유: 마이크로서비스 로컬 파일은 부서별 포스트잇의 현대판이다. 각 서비스가 자신의 파일을 관리하면, 50년 전 파일 시스템이 겪었던 중복·불일치 문제가 그대로 재발한다.

Ⅴ. 기대효과 및 결론

기대효과	내용
데이터 일관성	ACID 트랜잭션으로 항상 일관 상태
유지보수성	데이터 독립성으로 앱 수정 최소화
보안	중앙 접근 제어로 세밀한 권한 관리

파일 시스템 문제는 현대 분산 시스템에서 변형된 형태로 재등장한다. 분산 파일 시스템(HDFS), 오브젝트 스토리지(S3), NoSQL DB는 각각 다른 방식으로 파일 시스템의 확장성 문제를 해결하면서도 일관성 문제는 새로운 방식으로 다룬다(CAP 정리).

📢 섹션 요약 비유: CAP 정리는 파일 시스템 문제의 분산 시스템 버전이다. "일관성·가용성·파티션 내성 중 두 가지만 선택하라"는 CAP는 파일 시스템의 일관성 문제가 분산 환경에서 더욱 복잡해진다는 것을 보여준다.

📌 관련 개념 맵

개념	연결 포인트
데이터 독립성	파일 시스템 종속성 문제의 해결책
정규화	데이터 중복 제거
ACID	무결성·동시성 보장
CAP 정리	분산 환경의 일관성 트레이드오프
이벤트 소싱	마이크로서비스 상태 관리

📈 관련 키워드 및 발전 흐름도

[파일 시스템 — 데이터 중복·불일치·종속성 5대 문제]
    │
    ▼
[RDBMS — 정규화·ACID·SQL로 파일 시스템 문제 해결]
    │
    ▼
[분산 DB — CAP 정리, 일관성·가용성 트레이드오프]
    │
    ▼
[NoSQL — 스키마 유연성, 수평 확장]
    │
    ▼
[레이크하우스 — 파일 형식(Parquet)+ACID(Delta/Iceberg) 통합]

👶 어린이를 위한 3줄 비유 설명

파일 시스템 문제는 각 부서가 따로 포스트잇을 쓸 때 생기는 혼란이에요! DB는 모두가 공유하는 화이트보드예요.
DB는 중복·불일치·무결성 문제를 자동으로 해결해줘서 데이터를 항상 최신·정확하게 유지해요!
요즘 마이크로서비스에서도 똑같은 문제가 재발해서 이벤트 소싱이나 공유 DB 같은 해결책이 필요하답니다!