IT 서비스 관리 심화 (ITIL v4 & SRE)

별점: ★★★★★ | 기본 필수


답안.

Ⅰ. 개요

정의: 구글이 제안한 IT 운영 방법론. SW 엔지니어링 원칙으로 운영 문제를 해결. "시스템 신뢰성을 공학적으로 보장"

Ⅱ. 핵심 구성요소

정의: 구글이 제안한 IT 운영 방법론.
     SW 엔지니어링 원칙으로 운영 문제를 해결.
     "시스템 신뢰성을 공학적으로 보장"

[SRE vs ITIL]
ITIL: 프로세스·절차 중심, 규정 준수
SRE:  코드·자동화·측정 중심, 에러 버짓

[SRE 핵심 개념]
SLI (Service Level Indicator): 실제 측정 지표
  예) 요청 성공률, p95 지연시간

SLA (Service Level Agreement): 외부 약정
  예) 99.9% 가용성 보장

SLO (Service Level Objective): 내부 목표
  예) SLI 99.95% 목표 (SLA보다 높게)

에러 버짓 (Error Budget):
  100% - SLO 목표 = 허용 가능한 장애 시간
  예) 99.9% SLO = 8.76시간/년 에러 버짓
  에러 버짓 소진 시: 기능 릴리즈 중단, 신뢰성 집중

토일 (Toil): 자동화 가능한 수동 반복 작업
  SRE 엔지니어: Toil < 50% 목표
[세 가지 기둥]
메트릭 (Metrics): 숫자 기반 시계열 (CPU, 응답시간)


해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.

### Ⅲ. 특징 및 비교

핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.

### Ⅳ. 적용 사례

실무 환경에서의 적용 사례와 기대효과를 제시한다.

### Ⅴ. 전망

최신 기술 동향과 향후 발전 방향을 서술한다.