핵심 인사이트 (3줄 요약)
- 본질: 연합 학습(Federated Learning)은 원시 데이터를 한 곳에 모으지 않고 각 클라이언트에서 로컬 학습 후 그래디언트(Gradient)만 서버로 전송·집계하여 글로벌 모델을 학습하는 분산 학습 패러다임이다.
- 가치: 의료·금융 등 데이터 이동이 법적으로 제한되는 분야에서 데이터 주권을 유지하면서 AI 모델 성능을 향상시킬 수 있는 유일한 실용 방법이다.
- 판단 포인트: Gradient Leakage 공격 위험이 존재하므로 차분 프라이버시(Differential Privacy)와 보안 집계(Secure Aggregation)를 병행해야 실질적 프라이버시가 보장된다.
Ⅰ. 개요 및 필요성
전통적 중앙 집중식 머신러닝은 모든 데이터를 한 서버에 수집해 학습한다. 그러나 병원 환자 기록, 은행 거래 내역, 스마트폰 개인 메시지 등은 법적·윤리적으로 외부 전송이 불가능한 경우가 많다.
연합 학습 등장 배경
- GDPR, 개인정보보호법: 개인정보 국외 이전 규제
- 데이터 사일로(Data Silo): 경쟁 기업 간 데이터 공유 불가
- IoT/모바일: 수십억 대 기기에 분산된 데이터 활용 필요
구글이 2016년 Gboard(모바일 키보드)에 처음 적용한 이후, 의료 영상 진단(NVIDIA FLARE), 금융 사기 탐지에 확산됐다.
- 📢 섹션 요약 비유: 여러 병원이 환자 기록을 공유하지 않으면서도 공동으로 더 좋은 진단 AI를 만드는 것 — "레시피는 공유하되 식재료는 내 주방에 보관"하는 방식이다.
Ⅱ. 아키텍처 및 핵심 원리
글로벌 모델 배포
│
┌─────▼─────┐
│ 중앙 서버 │
│ (집계 서버) │
└─────┬─────┘
│ 그래디언트/가중치 수신
┌──────────┼──────────┐
│ │ │
┌───▼──┐ ┌───▼──┐ ┌───▼──┐
│병원A │ │병원B │ │병원C │
│로컬 │ │로컬 │ │로컬 │
│학습 │ │학습 │ │학습 │
└──────┘ └──────┘ └──────┘
데이터 이동 없음 (원시 데이터 로컬 유지)
FedAvg(Federated Averaging) 알고리즘 (McMahan et al., 2017)
- 서버가 글로벌 모델 가중치 W_t를 각 클라이언트에 전송
- 클라이언트i가 로컬 데이터로 E 에포크 SGD 수행 → ΔW_i 계산
- 서버가 가중치 평균 집계: W_{t+1} = Σ(n_i/n) × W_i
- 업데이트된 글로벌 모델 재배포
수평 vs 수직 연합 학습
| 항목 | 수평 FL (Horizontal) | 수직 FL (Vertical) |
|---|---|---|
| 데이터 구조 | 같은 피처, 다른 샘플 | 다른 피처, 같은 샘플 |
| 예시 | 여러 병원, 동일 질환 | 은행+보험사 동일 고객 |
| 통신 구조 | 중앙 서버 ↔ 클라이언트 | 피어 투 피어(Peer-to-Peer) |
| 주요 알고리즘 | FedAvg, FedProx | Split Learning |
- 📢 섹션 요약 비유: 수평 FL은 여러 학교가 같은 과목을 각자 가르치고 시험 점수만 공유, 수직 FL은 수학 선생님과 과학 선생님이 같은 학생을 분담 지도하는 것이다.
Ⅲ. 비교 및 연결
프라이버시 위협과 방어
Gradient Leakage 공격: 공유된 그래디언트로부터 원본 훈련 데이터 복원 가능 (DLG, iDLG 논문).
| 방어 기법 | 원리 | 프라이버시 수준 | 성능 손실 |
|---|---|---|---|
| 차분 프라이버시(DP-SGD) | 그래디언트에 가우시안 노이즈 추가 | 수학적 ε-DP 보장 | 중간~높음 |
| 보안 집계(Secure Aggregation) | 암호화된 그래디언트만 서버 수신 | 높음 | 통신 비용↑ |
| 동형 암호(Homomorphic Encryption) | 암호화 상태로 집계 연산 | 매우 높음 | 매우 높음 |
| 그래디언트 압축(Gradient Compression) | 스파스 통신으로 정보 노출 최소화 | 낮음 | 낮음 |
- 📢 섹션 요약 비유: 그래디언트는 요리 결과가 아닌 레시피 조각인데, 이 조각들을 모으면 원본 식재료(데이터)를 추론할 수 있어 DP 노이즈로 재료를 흐릿하게 만든다.
Ⅳ. 실무 적용 및 기술사 판단
실제 구현 프레임워크
- Flower(flwr): 유연한 오픈소스, 다양한 ML 프레임워크 지원
- NVIDIA FLARE: 의료 영상 특화, FDA 승인 임상 적용
- TensorFlow Federated(TFF): 구글 공식, 연구용
- PySyft: DP + 보안 집계 내장, 금융 적용
기술사 판단 포인트
- Non-IID 데이터 문제: 각 클라이언트 데이터 분포 불균일 → FedProx, FedNova로 보완
- 통신 비용: 대형 모델(LLM)의 그래디언트 전송 → 그래디언트 압축, LoRA 어댑터만 전송
- 무임승차(Free Rider) 문제: 기여 없이 글로벌 모델만 이용 → 기여도 평가(Shapley 기반 보상)
- 규제 적합성: GDPR 제17조(잊힐 권리) → 연합 학습에서 특정 클라이언트 탈퇴 메커니즘 설계 필요
- 📢 섹션 요약 비유: 연합 학습은 팀 프로젝트에서 각자 자기 노트는 집에 두고, 핵심 요약본만 공유해 최종 발표를 만드는 것이다.
Ⅴ. 기대효과 및 결론
연합 학습은 데이터 프라이버시와 AI 성능 향상이라는 두 마리 토끼를 잡는 핵심 기술이다. DP와 보안 집계를 결합한 프라이버시 보존 연합 학습은 의료·금융·통신 분야에서 규제 준수 AI의 표준 아키텍처로 자리잡고 있다.
- 📢 섹션 요약 비유: 연합 학습은 "개인 일기를 보여주지 않으면서도 더 나은 국어사전을 함께 만드는" 협력 방식이다.
📌 관련 개념 맵
| 개념 | 연결 포인트 |
|---|---|
| FedAvg | 연합 학습 알고리즘 · 가중치 평균 집계 |
| 수평 FL | 연합 학습 유형 · 같은 피처, 다른 샘플 |
| 수직 FL | 연합 학습 유형 · 다른 피처, 같은 샘플 |
| DP-SGD | 프라이버시 방어 · 그래디언트 노이즈 추가 |
| Gradient Leakage | 공격 · 그래디언트 기반 데이터 복원 |
📈 관련 키워드 및 발전 흐름도
[연합 학습 알고리즘 · 가중치 평균 집계] → [연합 학습 프라이버시 보존 그래디언트 집계] → [공격 · 그래디언트 기반 데이터 복원]
👶 어린이를 위한 3줄 비유 설명
- 여러 학교 학생들이 각자 집에서 공부하고 선생님에게 풀이 방법만 알려주면, 선생님이 가장 좋은 공부법을 만들어요 — 이게 연합 학습이에요.
- 학생들의 실제 일기(개인 데이터)는 절대 공유하지 않아요.
- 하지만 풀이 방법(그래디언트)에서도 일기 내용을 추론할 수 있어서 노이즈(잡음)를 섞어 보호해요.