핵심 인사이트 (3줄 요약)
- 본질: HPA (Horizontal Pod Autoscaler)는 파드 수를 조절하고, VPA (Vertical Pod Autoscaler)는 파드의 리소스 요청량을 조절한다.
- 가치: 트래픽 변화에 맞춰 자동으로 자원을 늘리거나 줄여 비용과 성능을 동시에 관리한다.
- 판단 포인트: 메트릭 기준, 리소스 경계, Cluster Autoscaler와의 조합을 함께 봐야 한다.
Ⅰ. 개요 및 필요성
서비스 트래픽은 늘 일정하지 않다. 피크를 대비해 과도하게 배치하면 비용이 낭비되고, 부족하면 장애가 난다.
쿠버네티스의 오토스케일링은 이 문제를 자동으로 완화한다.
- 📢 섹션 요약 비유: 사람이 많아지면 의자를 더 놓고, 사람이 줄면 다시 줄이는 식당 운영이다.
Ⅱ. HPA와 VPA
두 오토스케일러는 역할이 다르다.
- HPA: 파드 개수를 늘리거나 줄인다.
- VPA: 파드 한 개당 리소스 요청량을 조절한다.
트래픽 증가
↓
HPA: 파드 수 증가
VPA: 파드당 리소스 조정
이 둘은 같은 문제를 다른 축에서 해결한다.
- 📢 섹션 요약 비유: 손님이 많으면 테이블 수를 늘리고, 테이블당 접시 크기도 조절하는 것이다.
Ⅲ. 클러스터 레벨 확장
파드가 늘어도 노드가 부족하면 배치할 자리가 없다. 이때 Cluster Autoscaler가 노드를 추가한다.
HPA / VPA
↓
파드 증가 또는 리소스 증대
↓
Cluster Autoscaler
↓
노드 확장
그래서 파드, 컨테이너, 노드의 세 층을 함께 봐야 한다.
- 📢 섹션 요약 비유: 책상이 부족하면 의자만 늘리는 게 아니라 방 자체를 넓혀야 한다.
Ⅳ. 적용 시 주의점
HPA와 VPA는 동시에 쓰기 까다로운 경우가 있다.
- 메트릭 기준이 명확해야 한다.
- 상태 저장 서비스는 조심해야 한다.
- VPA가 재시작을 유발할 수 있다.
- 급격한 트래픽 변동은 별도 보호가 필요하다.
따라서 자동화만 믿지 말고 워크로드 특성을 알아야 한다.
- 📢 섹션 요약 비유: 자동 변속기라도 경사로에서는 운전 습관이 필요하다.
Ⅴ. 실무 기준과 비교
HPA는 사용자 수나 CPU 사용률처럼 수평 확장에 적합하고, VPA는 단일 파드의 자원 부족을 채울 때 유용하다.
운영자는 목표에 따라 선택해야 한다.
-
복제본 수 조절이 필요하면 HPA
-
파드 자원 조절이 필요하면 VPA
-
노드 부족까지 자동화하려면 Cluster Autoscaler
-
📢 섹션 요약 비유: 사람 수를 늘릴지, 각 사람의 일할 힘을 늘릴지, 건물 자체를 넓힐지 선택하는 문제다.
관련 개념 맵
트래픽 / 자원 사용량
↓
HPA / VPA
↓
Cluster Autoscaler
↓
자동 확장
관련 키워드 및 발전 흐름도
- 수동 용량 계획 → 비용과 장애 위험 증가
- HPA → 파드 수 자동 조절
- VPA → 파드 자원 자동 조정
- Cluster Autoscaler → 노드 확장 연동
- 다층 오토스케일링 → 클라우드 운영 최적화
어린이를 위한 3줄 비유 설명
사람이 많아지면 의자를 더 놓는 게 HPA예요.
의자 하나당 크기를 바꾸는 게 VPA예요.
자리가 부족하면 방을 더 넓히는 게 노드 확장이에요.