SRE (Site Reliability Engineering), SLA/SLO/SLI, 관측성 (Observability)
출제 빈도: ★★★★★ | 난이도: ★★★★☆
답안.
Ⅰ. 개요
SRE는 소프트웨어 공학 기법으로 시스템 운영 문제를 해결하고 신뢰성을 관리하는 운영 모델이다.
SLI는 관측 지표, SLO는 내부 목표, SLA는 고객 계약 수준을 의미하며 세 계층을 구분해 관리해야 한다.
관측성은 로그, 메트릭, 트레이스를 통해 시스템 내부 상태를 추론하고 장애 원인을 빠르게 파악하는 능력이다.
Ⅱ. 핵심 구성요소
Ⅰ. 개요
1. 정의
2. 서비스 복잡성 증가와 가용성 요구 확대
Ⅱ. 핵심 구성요소
1. 신뢰성 운영 프레임
2. 관측성과 장애 대응 체계
Ⅲ. 특징 및 장단점
1. 운영 품질 향상과 문제 해결 속도 개선
2. 과도한 알람과 잘못된 목표 설정 위험
Ⅳ. 유사 기술과의 비교
- SLA vs SLO vs SLI 비교표
Ⅴ. 적용사례 및 향후전망
1. 대규모 온라인 서비스의 신뢰성 운영
2. OpenTelemetry 기반 표준화와 자동 분석 확대
해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.
Ⅲ. 특징 및 비교
핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.
Ⅳ. 적용 사례
실무 환경에서의 적용 사례와 기대효과를 제시한다.
Ⅴ. 전망
최신 기술 동향과 향후 발전 방향을 서술한다.