핵심 인사이트 (3줄 요약)
- 본질: 비지도 학습은 정답 라벨 없이 데이터의 내재된 구조·패턴·군집을 자동 발견하는 ML 패러다임이며, 클러스터링·차원 축소·이상 탐지·생성 모델이 대표 기법이다.
- 가치: 실세계 데이터의 95% 이상은 라벨이 없으므로, 라벨링 없이도 고객 세그먼테이션·이상 거래 탐지·데이터 시각화에 활용할 수 있다.
- 판단 포인트: K-Means(클러스터링)·PCA(차원 축소)·Autoencoder(표현 학습)·DBSCAN(밀도 기반 클러스터링)을 구분하고, Self-supervised Learning(BERT·GPT)은 비지도의 현대적 진화 형태이다.
Ⅰ. 개요 및 필요성
┌───────────────────────────────────────────────────────┐
│ 비지도 학습 주요 유형 │
├───────────────────────────────────────────────────────┤
│ [클러스터링] [차원 축소] │
│ K-Means PCA │
│ DBSCAN t-SNE │
│ Gaussian Mixture UMAP │
│ │
│ [이상 탐지] [생성 모델] │
│ Isolation Forest Autoencoder │
│ One-Class SVM VAE, GAN │
└───────────────────────────────────────────────────────┘
- 📢 섹션 요약 비유: 지도 학습은 선생님이 정답을 알려주는 수업이고, 비지도 학습은 학생이 스스로 규칙을 발견하는 탐구 활동이다.
Ⅱ. 아키텍처 및 핵심 원리
주요 기법 비교
| 기법 | 유형 | 대표 | 용도 |
| K-Means | 클러스터링 | K개 중심 | 고객 세그먼테이션 |
| PCA | 차원 축소 | 선형 | 고차원 시각화 |
| DBSCAN | 밀도 클러스터링 | 밀도 | 이상치 탐지 |
| Autoencoder | 표현 학습 | 신경망 | 피처 추출 |
- 📢 섹션 요약 비유: K-Means는 비슷한 학생끼리 반 나누기이고, PCA는 성적표의 핵심 과목만 추려서 비교하는 것이다.
Ⅲ. 비교 및 연결
| 비교 | 지도 | 비지도 | 자기 지도 |
| 라벨 | 있음 | 없음 | 자동 생성 |
| 목표 | 예측 | 구조 발견 | 표현 학습 |
| 대표 | SVM, XGBoost | K-Means, PCA | BERT, GPT |
Ⅳ. 실무 적용 및 기술사 판단
활용 시나리오
- 고객 세그먼테이션: K-Means로 VIP·일반·이탈 위험 고객 분류.
- 이상 거래 탐지: Isolation Forest로 사기 거래 식별.
- 데이터 시각화: t-SNE/UMAP으로 고차원 데이터를 2D로 시각화.
Ⅴ. 기대효과 및 결론
비지도 학습은 라벨 없는 대량 데이터에서 가치를 추출하는 핵심 기법이며, Self-supervised Learning으로 진화하여 GPT·BERT의 사전 학습 기반이 되었다.
📌 관련 개념 맵
| 개념 | 연결 포인트 |
| K-Means | 중심 기반 클러스터링 |
| PCA | 선형 차원 축소 |
| DBSCAN | 밀도 기반 클러스터링 |
| Autoencoder | 비지도 표현 학습 |
| Self-supervised | 비지도의 현대적 진화 (BERT) |
📈 관련 키워드 및 발전 흐름도
[K-Means / PCA (통계학, 1960s~)]
│
▼
[DBSCAN (1996) — 밀도 기반 클러스터링]
│
▼
[Autoencoder / VAE (2013~) — 신경망 비지도]
│
▼
[t-SNE / UMAP (시각화, 2018~)]
│
▼
[현재: Self-supervised (BERT·GPT) — 비지도의 극한 진화]
👶 어린이를 위한 3줄 비유 설명
- 비지도 학습은 정답 없이 퍼즐을 맞추는 거예요. 비슷한 조각끼리 모아봐요.
- K-Means는 구슬을 색깔별로 분류하는 것이고, PCA는 구슬의 핵심 특징만 추려내는 거예요.
- 정답을 모르지만 규칙을 스스로 발견할 수 있어서 정말 대단해요!