핵심 인사이트

  1. 본질: 문제(Problem)는 인시던트의 근본 원인이며, 문제 관리 목표는 재발을 원천 차단하는 것이다. KEDB(Known Error Database)는 이 과정의 핵심 지식 자산이다.
  2. 가치: 반복 인시던트 패턴을 문제로 등록해 RCA(Root Cause Analysis)를 완료하면 L1 FCR을 높이고 전체 MTTR을 구조적으로 낮출 수 있다.
  3. 판단 포인트: 문제 관리는 반응적(Reactive)과 선제적(Proactive) 두 유형이 있으며, 성숙도 높은 조직은 인시던트 발생 전에 문제를 탐지하는 선제적 접근을 추구한다.

Ⅰ. 개요 및 필요성

문제 관리(Problem Management)는 ITIL v3 SO(서비스 운영)의 핵심 프로세스로, 인시던트의 근본 원인을 분석해 재발을 방지한다. 문제(Problem)는 인시던트와 달리 즉각 복구가 목적이 아니므로 시간을 들여 5 Whys, 어골도(Fishbone), 결함 트리 분석(FTA) 등의 체계적 분석 기법을 사용한다. 근본 원인이 파악되면 Known Error(알려진 오류)로 등록하고, Workaround와 영구 수정 방안을 KEDB에 기록한다.

선제적 문제 관리는 인시던트 발생 전에 트렌드 분석·용량 모니터링·취약점 스캔을 통해 잠재 문제를 사전에 식별한다. 이는 AIOps와 결합 시 이상 감지(Anomaly Detection)로 인시던트가 발생하기 전 문제를 예측하는 방향으로 진화하고 있다.

📢 섹션 요약 비유: 문제 관리는 '왜 자꾸 이 도로에 사고가 나는지' 조사해 신호등을 설치하거나 도로를 재설계하는 것이다. 인시던트 관리가 사고 수습이라면 문제 관리는 사고 예방 인프라다.

Ⅱ. 아키텍처 및 핵심 원리

단계활동산출물
1. 문제 탐지반복 인시던트 패턴, 선제적 모니터링문제 레코드 생성
2. 문제 분류영향 서비스, 중요도, 긴급도 평가분류된 문제 레코드
3. RCA 수행5 Whys, 어골도, FTA 분석근본 원인 문서
4. Known Error 등록원인 확인 + Workaround 작성KEDB 업데이트
5. 수정 방안 결정영구 수정 vs. Workaround 유지 결정RFC (변경 요청)
6. 문제 종료수정 완료 검증 후 종료, 교훈 기록PIR (종료 보고서)
┌───────────────────────────────────────────────────────────────┐
│              문제 관리 흐름 및 KEDB 연계                       │
│                                                               │
│  반복 인시던트 / 선제 탐지                                    │
│         │                                                     │
│         ▼                                                     │
│  ┌─────────────────┐   RCA 분석   ┌────────────────────────┐ │
│  │  문제 레코드     │ ──────────▶ │  근본 원인 확인         │ │
│  │  (Problem Record)│             │  5 Whys / 어골도 / FTA │ │
│  └─────────────────┘             └──────────────┬─────────┘ │
│                                                 │            │
│                                  Known Error? ──┘            │
│                                                 ▼            │
│                                  ┌──────────────────────┐    │
│                                  │   KEDB 등록           │    │
│                                  │  - 원인 설명          │    │
│                                  │  - Workaround        │    │
│                                  │  - 영구 수정 방안    │    │
│                                  └──────────────┬───────┘    │
│                                                 │            │
│                                RFC(변경 요청) ──┘            │
│                                                 ▼            │
│                                       변경 관리 → 수정 배포  │
└───────────────────────────────────────────────────────────────┘

📢 섹션 요약 비유: KEDB는 병원의 '잘 알려진 질병 치료 매뉴얼'이다. 같은 증상이 오면 매뉴얼을 꺼내 빠르게 처치하고, 치료법이 없으면 연구팀(L3)이 새 치료법을 개발한다.

Ⅲ. 비교 및 연결

항목반응적 문제 관리선제적 문제 관리
트리거반복 인시던트 발생 후모니터링·트렌드 분석으로 사전 탐지
시점인시던트 이후인시던트 발생 전
주요 도구ITSM 티켓 분석, RCAAIOps, 이상 탐지, 용량 계획
효과재발 방지인시던트 발생 자체 감소
성숙도중간 수준높은 수준

📢 섹션 요약 비유: 반응적 문제 관리가 사고 후 블랙박스 분석이라면, 선제적 문제 관리는 운전 중 AI가 위험 패턴을 감지해 미리 경보를 내리는 ADAS(첨단 운전 보조 시스템)다.

Ⅳ. 실무 적용 및 기술사 판단

KEDB의 가치는 '서비스 데스크 FCR 향상'에서 즉시 나타난다. L1 상담원이 KEDB에서 Workaround를 찾아 1차 통화에서 해결하면 FCR이 올라가고 MTTR이 줄어든다. 문제 레코드와 인시던트 레코드를 CMDB CI와 연결하면 어느 CI가 가장 많은 문제를 유발하는지 '문제 원인 CI 순위'를 산출할 수 있어 인프라 개선 우선순위 결정에 활용된다. SRE 조직에서 Postmortem(사후 검토) 문화가 바로 선제적 문제 관리의 실천 형태다.

📢 섹션 요약 비유: 문제 관리 없는 ITSM은 같은 수학 문제를 매번 처음부터 푸는 학생과 같다. KEDB는 오답 노트—한 번 틀렸던 문제와 정답을 모아두어 다음에 빠르게 해결하는 도구다.

Ⅴ. 기대효과 및 결론

체계적인 문제 관리와 KEDB 활용은 조직의 인시던트 수를 연 20~40% 감소시키며, 반복 장애 대응에 낭비되던 인력을 혁신 프로젝트로 전환할 수 있게 한다. SRE의 Postmortem 문화와 결합하면 '비난 없는 개선(Blameless Postmortem)' 조직 문화까지 형성된다.

📢 섹션 요약 비유: 문제 관리는 조직의 면역 시스템이다. 한 번 감염된 바이러스를 분석해 항체(KEDB)를 만들어두면, 다음에 같은 바이러스가 와도 몸이 빠르게 방어한다.

📌 관련 개념 맵

개념설명연관 키워드
Known Error원인과 Workaround가 파악된 문제KEDB, 문제 관리
KEDB (Known Error Database)알려진 오류 및 해결책 저장소서비스 데스크, L1 FCR
RCA (Root Cause Analysis)근본 원인 분석 기법5 Whys, 어골도, FTA
PostmortemSRE의 장애 사후 검토Blameless, 교훈 기록
RFC (Request for Change)문제 해결을 위한 변경 요청변경 관리, CAB

👶 어린이를 위한 3줄 비유 설명

  1. 문제 관리는 '왜 자꾸 같은 곳에서 넘어지는지' 원인을 찾아 돌을 치우는 작업이에요.
  2. 돌을 치우기 전까지는 '여기 조심하세요' 팻말(Workaround)을 세워둬요.
  3. KEDB는 이런 위험한 곳과 임시 해결책을 모두 적어둔 위험 지도예요.