핵심 인사이트 (3줄 요약)

  1. 본질: HPA (Horizontal Pod Autoscaler)는 파드 수를 조절하고, VPA (Vertical Pod Autoscaler)는 파드의 리소스 요청량을 조절한다.
  2. 가치: 트래픽 변화에 맞춰 자동으로 자원을 늘리거나 줄여 비용과 성능을 동시에 관리한다.
  3. 판단 포인트: 메트릭 기준, 리소스 경계, Cluster Autoscaler와의 조합을 함께 봐야 한다.

Ⅰ. 개요 및 필요성

서비스 트래픽은 늘 일정하지 않다. 피크를 대비해 과도하게 배치하면 비용이 낭비되고, 부족하면 장애가 난다.

쿠버네티스의 오토스케일링은 이 문제를 자동으로 완화한다.

  • 📢 섹션 요약 비유: 사람이 많아지면 의자를 더 놓고, 사람이 줄면 다시 줄이는 식당 운영이다.

Ⅱ. HPA와 VPA

두 오토스케일러는 역할이 다르다.

  • HPA: 파드 개수를 늘리거나 줄인다.
  • VPA: 파드 한 개당 리소스 요청량을 조절한다.
트래픽 증가
   ↓
HPA: 파드 수 증가
VPA: 파드당 리소스 조정

이 둘은 같은 문제를 다른 축에서 해결한다.

  • 📢 섹션 요약 비유: 손님이 많으면 테이블 수를 늘리고, 테이블당 접시 크기도 조절하는 것이다.

Ⅲ. 클러스터 레벨 확장

파드가 늘어도 노드가 부족하면 배치할 자리가 없다. 이때 Cluster Autoscaler가 노드를 추가한다.

HPA / VPA
   ↓
파드 증가 또는 리소스 증대
   ↓
Cluster Autoscaler
   ↓
노드 확장

그래서 파드, 컨테이너, 노드의 세 층을 함께 봐야 한다.

  • 📢 섹션 요약 비유: 책상이 부족하면 의자만 늘리는 게 아니라 방 자체를 넓혀야 한다.

Ⅳ. 적용 시 주의점

HPA와 VPA는 동시에 쓰기 까다로운 경우가 있다.

  • 메트릭 기준이 명확해야 한다.
  • 상태 저장 서비스는 조심해야 한다.
  • VPA가 재시작을 유발할 수 있다.
  • 급격한 트래픽 변동은 별도 보호가 필요하다.

따라서 자동화만 믿지 말고 워크로드 특성을 알아야 한다.

  • 📢 섹션 요약 비유: 자동 변속기라도 경사로에서는 운전 습관이 필요하다.

Ⅴ. 실무 기준과 비교

HPA는 사용자 수나 CPU 사용률처럼 수평 확장에 적합하고, VPA는 단일 파드의 자원 부족을 채울 때 유용하다.

운영자는 목표에 따라 선택해야 한다.

  • 복제본 수 조절이 필요하면 HPA

  • 파드 자원 조절이 필요하면 VPA

  • 노드 부족까지 자동화하려면 Cluster Autoscaler

  • 📢 섹션 요약 비유: 사람 수를 늘릴지, 각 사람의 일할 힘을 늘릴지, 건물 자체를 넓힐지 선택하는 문제다.


관련 개념 맵

트래픽 / 자원 사용량
   ↓
HPA / VPA
   ↓
Cluster Autoscaler
   ↓
자동 확장

관련 키워드 및 발전 흐름도

  1. 수동 용량 계획 → 비용과 장애 위험 증가
  2. HPA → 파드 수 자동 조절
  3. VPA → 파드 자원 자동 조정
  4. Cluster Autoscaler → 노드 확장 연동
  5. 다층 오토스케일링 → 클라우드 운영 최적화

어린이를 위한 3줄 비유 설명

사람이 많아지면 의자를 더 놓는 게 HPA예요.
의자 하나당 크기를 바꾸는 게 VPA예요.
자리가 부족하면 방을 더 넓히는 게 노드 확장이에요.