핵심 인사이트 (3줄 요약)
- 본질: SLA는 서비스 제공자와 고객 간의 서비스 품질에 대한 공식 계약이며, SLO 미달 시 크레딧 환불·위약금 등 법적 책임이 발생하는 비즈니스 문서이다.
- 가치: SLA가 없으면 서비스 장애 시 "얼마나 보상받을 수 있는가?"에 대한 기준이 없지만, SLA는 99.9% 가용성 미달 시 월 요금의 10% 크레딧 등 명확한 보상 규칙을 정의한다.
- 판단 포인트: SLA ≥ SLO(내부 목표가 더 엄격해야 여유 확보)이며, 클라우드 서비스(AWS·GCP·Azure)는 모두 공개 SLA를 제공한다.
Ⅰ. 개요 및 필요성
┌───────────────────────────────────────────────────────┐
│ SLI → SLO → SLA 계층 │
├───────────────────────────────────────────────────────┤
│ SLI = 99.95% (측정 결과) │
│ SLO = 99.9% (내부 목표) → SLI > SLO ✅ OK │
│ SLA = 99.5% (고객 계약) → SLI > SLA ✅ 계약 준수 │
│ │
│ SLI가 SLA 미달(99.4%): │
│ → 계약 위반 → 월 요금 10% 크레딧 반환 │
│ │
│ 핵심: SLO(엄격) > SLA(느슨) → 내부 여유 확보 │
└───────────────────────────────────────────────────────┘
- 📢 섹션 요약 비유: SLA는 보험 계약이다. "화재(장애) 시 보험금(크레딧) 지급"처럼, 서비스 품질 미달 시 보상을 약속한다.
Ⅱ. 아키텍처 및 핵심 원리
클라우드 SLA 예시
| 서비스 | SLA | 위반 시 |
| AWS EC2 | 99.99% | 10~30% 크레딧 |
| GCP Compute | 99.99% | 10~50% 크레딧 |
| Azure VM | 99.95% | 10~100% 크레딧 |
SLA 포함 항목
- 서비스 범위: 어떤 서비스에 적용되는가.
- 가용성 목표: 99.9%, 99.99% 등.
- 측정 방법: SLI 정의·측정 주기.
- 위반 보상: 크레딧 비율·청구 절차.
- 면책 조항: 불가항력·유지보수 시간.
- 📢 섹션 요약 비유: SLA는 식당 메뉴판의 "음식이 30분 안에 안 나오면 무료!" 같은 품질 보증이다.
Ⅲ. 비교 및 연결
| 비교 | SLI | SLO | SLA |
| 성격 | 측정 | 내부 목표 | 외부 계약 |
| 위반 시 | 알림 | Budget 소진 | 법적 보상 |
| 엄격도 | - | 높음 | 낮음 |
Ⅳ. 실무 적용 및 기술사 판단
SLA 설계 Best Practice
- SLO를 SLA보다 엄격하게 설정 (여유 확보).
- SLA 위반 알림을 Error Budget이 50% 시점에 발동.
- 유지보수 윈도우는 SLA 계산에서 제외.
Ⅴ. 기대효과 및 결론
SLA는 서비스 신뢰성의 비즈니스 표현이며, SLI→SLO→Error Budget→SLA의 체계적 관리가 SRE의 핵심이다.
📌 관련 개념 맵
| 개념 | 연결 포인트 |
| SLI | SLA의 측정 기반 |
| SLO | SLA보다 엄격한 내부 목표 |
| Error Budget | SLO에서 파생, SLA 준수 여유 |
| 크레딧 | SLA 위반 시 보상 수단 |
| 면책 조항 | 불가항력·유지보수 제외 규정 |
📈 관련 키워드 및 발전 흐름도
[전통 SLA (통신·호스팅, 2000s)]
│
▼
[클라우드 SLA (AWS·GCP·Azure, 2010~)]
│
▼
[SRE — SLI/SLO/Error Budget 체계 (2016)]
│
▼
[OpenSLO — SLA/SLO를 코드로 정의 (2022~)]
│
▼
[현재: AI SLA — AI 서비스 성능 보장 계약]
👶 어린이를 위한 3줄 비유 설명
- SLA는 식당의 "30분 안에 안 나오면 무료!" 같은 약속이에요.
- 약속(SLA)을 못 지키면 돈을 돌려줘야(크레딧) 해요.
- 그래서 식당(서비스)은 약속보다 더 빨리(SLO) 음식을 내놓으려고 노력해요!