58. HPA / VPA - 쿠버네티스 자동 확장 전략

핵심 인사이트 (3줄 요약)

본질: HPA (Horizontal Pod Autoscaler)는 파드 수를 조절하고, VPA (Vertical Pod Autoscaler)는 파드의 리소스 요청량을 조절한다.

가치: 트래픽 변화에 맞춰 자동으로 자원을 늘리거나 줄여 비용과 성능을 동시에 관리한다.

판단 포인트: 메트릭 기준, 리소스 경계, Cluster Autoscaler와의 조합을 함께 봐야 한다.

Ⅰ. 개요 및 필요성

서비스 트래픽은 늘 일정하지 않다. 피크를 대비해 과도하게 배치하면 비용이 낭비되고, 부족하면 장애가 난다.

쿠버네티스의 오토스케일링은 이 문제를 자동으로 완화한다.

📢 섹션 요약 비유: 사람이 많아지면 의자를 더 놓고, 사람이 줄면 다시 줄이는 식당 운영이다.

Ⅱ. HPA와 VPA

두 오토스케일러는 역할이 다르다.

HPA: 파드 개수를 늘리거나 줄인다.
VPA: 파드 한 개당 리소스 요청량을 조절한다.

트래픽 증가
   ↓
HPA: 파드 수 증가
VPA: 파드당 리소스 조정

이 둘은 같은 문제를 다른 축에서 해결한다.

📢 섹션 요약 비유: 손님이 많으면 테이블 수를 늘리고, 테이블당 접시 크기도 조절하는 것이다.

Ⅲ. 클러스터 레벨 확장

파드가 늘어도 노드가 부족하면 배치할 자리가 없다. 이때 Cluster Autoscaler가 노드를 추가한다.

HPA / VPA
   ↓
파드 증가 또는 리소스 증대
   ↓
Cluster Autoscaler
   ↓
노드 확장

그래서 파드, 컨테이너, 노드의 세 층을 함께 봐야 한다.

📢 섹션 요약 비유: 책상이 부족하면 의자만 늘리는 게 아니라 방 자체를 넓혀야 한다.

Ⅳ. 적용 시 주의점

HPA와 VPA는 동시에 쓰기 까다로운 경우가 있다.

메트릭 기준이 명확해야 한다.
상태 저장 서비스는 조심해야 한다.
VPA가 재시작을 유발할 수 있다.
급격한 트래픽 변동은 별도 보호가 필요하다.

따라서 자동화만 믿지 말고 워크로드 특성을 알아야 한다.

📢 섹션 요약 비유: 자동 변속기라도 경사로에서는 운전 습관이 필요하다.

Ⅴ. 실무 기준과 비교

HPA는 사용자 수나 CPU 사용률처럼 수평 확장에 적합하고, VPA는 단일 파드의 자원 부족을 채울 때 유용하다.

운영자는 목표에 따라 선택해야 한다.

복제본 수 조절이 필요하면 HPA
파드 자원 조절이 필요하면 VPA
노드 부족까지 자동화하려면 Cluster Autoscaler
📢 섹션 요약 비유: 사람 수를 늘릴지, 각 사람의 일할 힘을 늘릴지, 건물 자체를 넓힐지 선택하는 문제다.

어린이를 위한 3줄 비유 설명

사람이 많아지면 의자를 더 놓는 게 HPA예요.
의자 하나당 크기를 바꾸는 게 VPA예요.
자리가 부족하면 방을 더 넓히는 게 노드 확장이에요.