139. 처리량 (Throughput)

핵심 인사이트 (3줄 요약)

본질: 처리량 (Throughput)은 시스템이 단위 시간 동안 완료해 낸 작업의 총량이며, "얼마나 빨리 하나를 끝내는가"보다 "얼마나 많이 계속 끝내는가"를 본다.

가치: 서버, 데이터베이스, 네트워크, 프로세서에서는 개별 작업의 체감 속도보다 전체 서비스 수용량이 더 중요할 때가 많아, 처리량이 곧 비용 효율과 확장성의 핵심 지표가 된다.

판단 포인트: 처리량을 높이려면 파이프라이닝 (Pipelining), 병렬화, 병목 제거가 필요하지만, 자원 사용률을 끝까지 밀어붙이면 응답 시간 (Response Time) 악화와 대기열 폭증이 함께 온다.

Ⅰ. 개요 및 필요성

처리량 (Throughput)은 컴퓨터 시스템이 일정 시간 동안 끝낸 작업량을 뜻하는 성능 지표다. 예를 들어 웹 서버는 초당 요청 수, 데이터베이스는 초당 트랜잭션 수, 네트워크는 초당 전송 비트 수, 중앙처리장치인 CPU (Central Processing Unit)는 초당 완료 명령어 수처럼 표현할 수 있다. 즉 처리량은 "한 건의 속도"가 아니라 "전체 생산량"을 보는 관점이다.

이 개념이 중요해진 이유는 현대 시스템이 대부분 다수의 요청을 동시에 상대하기 때문이다. 검색 엔진, 스트리밍 서버, 은행 계정 정산, 인공지능 추론 서비스는 한 사용자의 반응성도 중요하지만, 결국 같은 시간 안에 얼마나 많은 요청을 안전하게 처리하느냐가 사업성과 직결된다. 처리량 관점이 없으면 시스템은 순간적으로 빨라 보여도, 사용자가 몰릴 때 급격히 포화되어 전체 서비스 품질을 유지하지 못한다.

특히 배치 처리 (Batch Processing), 클라우드 백엔드, 멀티코어 기반 연산에서는 "자원을 놀리지 않는 것"이 핵심이다. 단일 작업 하나를 극단적으로 빠르게 만드는 것보다, 여러 작업을 끊김 없이 흘려보내도록 설계하는 편이 실제 운영 효율이 더 높다. 그래서 컴퓨터 구조에서는 파이프라인, 슈퍼스칼라, 캐시, 메모리 대역폭, 입출력 병렬화가 모두 처리량 향상이라는 큰 목표 아래 연결된다.

📢 섹션 요약 비유: 처리량은 놀이공원에서 롤러코스터 한 바퀴 속도보다 하루 동안 몇 명을 태웠는지를 보는 것과 같다. 한 사람을 아주 빨리 내려보내도 다음 탑승 준비가 느리면 전체 손님 수는 늘지 않는다.

Ⅱ. 아키텍처 및 핵심 원리

처리량은 보통 완료된 작업 수 / 시간으로 이해하면 된다. 핵심은 각 작업의 전체 소요시간을 무조건 줄이는 것이 아니라, 시스템 내부 자원을 겹쳐 사용해 완료 이벤트가 더 자주 나오게 만드는 데 있다. 이때 중요한 설계 수단이 파이프라이닝, 병렬 실행, 자원 중복 배치, 병목 구간 축소다.

아래 그림은 왜 파이프라이닝이 처리량을 높이는지 보여준다. 각 작업은 여전히 세 단계를 거치지만, 서로 다른 단계가 동시에 진행되면서 출력 간격이 짧아진다.

┌──────────────────────────────────────────────────────────────────┐
│        처리량 향상 원리: "작업을 겹쳐 완료 간격을 줄인다"       │
├──────────────────────────────────────────────────────────────────┤
│ 단계 표기: [가]=가져오기  [해]=해석  [실]=실행                  │
│                                                                  │
│ 비파이프라인                                                      │
│ 시간 →   1     2     3     4     5     6     7     8     9       │
│ 작업 A  [가]  [해]  [실]                                         │
│ 작업 B                    [가]  [해]  [실]                       │
│ 작업 C                                       [가]  [해]  [실]    │
│ 완료 시점: 3, 6, 9                                                │
│                                                                  │
│ 파이프라인                                                        │
│ 시간 →   1     2     3     4     5                               │
│ 작업 A  [가]  [해]  [실]                                         │
│ 작업 B        [가]  [해]  [실]                                   │
│ 작업 C              [가]  [해]  [실]                             │
│ 완료 시점: 3, 4, 5                                                │
│                                                                  │
│ 결과: 첫 완료 시점은 비슷해도 완료 결과 배출 간격은 더 짧아진다  │
└──────────────────────────────────────────────────────────────────┘

이 그림의 핵심은 개별 작업의 지연은 크게 줄지 않아도, 완료 결과가 나오는 간격이 줄어든다는 점이다. CPU 파이프라인에서는 한 명령어가 실행 단계에 있을 때 다음 명령어는 해석 단계, 그다음 명령어는 인출 단계에 들어갈 수 있다. 이렇게 되면 파이프라인이 가득 찬 뒤에는 매 클럭마다 결과가 하나씩 나오므로 처리량이 증가한다.

향상 수단	처리량에 주는 효과	주의할 점
파이프라이닝 (Pipelining)	완료 결과 배출 간격 단축	해저드 (Hazard) 발생 가능
멀티코어 (Multi-Core)	동시에 처리 가능한 작업 수 증가	동기화 비용, 메모리 경쟁
캐시 (Cache) 최적화	메모리 대기 감소	지역성 부족 시 효과 제한
입출력 병렬화	디스크/네트워크 병목 완화	큐 관리 복잡도 증가

즉 처리량은 단순히 "더 빠른 코어 1개"의 문제가 아니다. 연산기, 메모리, 버스, 저장장치, 네트워크가 모두 균형 있게 흘러야 높은 처리량이 나온다. 한 구간만 빠르고 나머지가 막히면 전체 시스템은 가장 느린 구간의 처리율에 묶인다.

📢 섹션 요약 비유: 처리량 설계는 세탁기 한 대를 초고속으로 돌리는 일보다 세탁-건조-접기 공정을 겹쳐서 계속 옷이 나오게 만드는 세탁소 운영에 가깝다. 중요한 것은 한 벌의 감동적인 속도가 아니라, 문 닫기 전까지 몇 벌을 끝냈는가다.

Ⅲ. 비교 및 연결

처리량을 제대로 이해하려면 응답 시간과 대역폭을 함께 봐야 한다. 처리량은 완료량, 응답 시간은 한 건의 체감 지연, 대역폭 (Bandwidth)은 이동 가능한 데이터 양의 상한에 가깝다. 세 개는 비슷해 보이지만 설계에서 담당하는 질문이 다르다.

항목	처리량 (Throughput)	응답 시간 (Response Time)	대역폭 (Bandwidth)
핵심 질문	단위 시간당 몇 건을 끝내는가	한 건이 끝나기까지 얼마나 걸리는가	이론상 얼마만큼 흘려보낼 수 있는가
대표 단위	TPS (Transactions Per Second), RPS (Requests Per Second), IPC (Instructions Per Cycle)	ms, ns, s	MB/s, Gb/s
주 최적화 대상	전체 생산성, 수용량	사용자 체감, 실시간성	전송 경로의 폭
위험	포화 시 지연 급증	개별 요청 최적화에 자원 과소활용	상한만 높고 실제 활용률 낮을 수 있음

여기서 자주 헷갈리는 지점이 있다. 대역폭이 크다고 항상 처리량이 높은 것은 아니다. 예를 들어 메모리 버스 폭은 넓어도 캐시 미스가 많거나 잠금 경합이 심하면 실제 완료 작업 수는 늘지 않는다. 반대로 응답 시간을 약간 양보하더라도 큐 운영과 병렬화가 잘 되면 전체 처리량은 크게 개선될 수 있다.

운영체제에서는 스케줄링 정책이 처리량과 응답 시간의 균형을 바꾼다. 네트워크에서는 패킷 손실과 혼잡 제어가 실제 처리량을 깎는다. 데이터베이스에서는 락 경합과 디스크 쓰기 지연이 초당 완료 트랜잭션 수를 제한한다. 따라서 처리량은 분야가 달라도 결국 "흐름을 막는 지점이 어디인가"라는 공통 질문으로 수렴한다.

컴퓨터 구조 관점에서는 결국 병목의 위치를 찾는 일이 처리량 분석의 핵심이다. ALU (Arithmetic Logic Unit)가 느린지, 메모리가 막히는지, 분기 예측 실패로 파이프라인이 비는지, 입출력 큐가 넘치는지를 봐야 한다. 처리량은 단일 부품의 능력이 아니라, 전체 경로에서 가장 약한 고리가 정한다.

📢 섹션 요약 비유: 처리량과 응답 시간의 차이는 버스와 택시의 차이와 같다. 택시는 한 사람을 빨리 데려다줄 수 있지만, 출근길 도시 전체를 움직이는 힘은 많은 사람을 꾸준히 실어 나르는 버스 쪽에 있다.

Ⅳ. 실무 적용 및 기술사 판단

실무에서는 "어떤 워크로드에 무엇을 최적화할 것인가"가 가장 중요하다. 온라인 게임 입력 처리, 제동 제어, 고빈도 거래처럼 즉시성이 핵심인 시스템은 응답 시간을 먼저 봐야 한다. 반대로 로그 분석, 영상 인코딩, 대규모 웹 API (Application Programming Interface) 서버, 배치 정산처럼 요청 수가 많고 병렬성이 큰 시스템은 처리량 중심 설계가 더 합리적이다.

판단 체크리스트

병목 자원이 어디인가? CPU, 메모리, 디스크, 네트워크, 락 중 어느 자원이 먼저 포화되는지 확인해야 한다.
자원 사용률이 너무 높은가? 평균 사용률이 높아도 대기열 길이와 지연 분포가 나빠지면 실제 서비스 품질은 급격히 떨어진다.
병렬화 이득이 진짜 있는가? 코어 수를 늘려도 공유 자원 경합이 크면 처리량이 선형 증가하지 않는다.
배치 크기와 큐 길이가 적절한가? 너무 작은 배치는 오버헤드를 키우고, 너무 큰 배치는 지연과 메모리 사용량을 악화시킨다.

실무 예시

웹 서버: 초당 요청 수가 목표라면 커넥션 처리, 스레드/이벤트 모델, 캐시, 로드 밸런싱을 통해 처리량을 높인다.
데이터베이스: 초당 트랜잭션 수를 늘리려면 인덱스 설계, 로그 쓰기 병목, 락 경쟁, 스토리지 IOPS (Input/Output Operations Per Second)를 함께 봐야 한다.
CPU 설계: IPC (Instructions Per Cycle)를 높이려면 파이프라인 효율, 분기 예측, 캐시 히트율, 메모리 병목 완화가 동시에 필요하다.

안티패턴

사용률 100%에 가까운 상태를 "효율적"이라고만 해석하는 것
평균 처리량만 보고 지연 폭증 구간을 무시하는 것
코어 수만 늘리면 무조건 확장된다고 가정하는 것

결국 기술사 답안이나 실무 설계에서는 "처리량을 높여야 하는 업무인지, 응답 시간을 지켜야 하는 업무인지"를 먼저 구분해야 한다. 그리고 처리량 목표를 택했다면, 단순 성능 자랑이 아니라 병목 제거 + 병렬성 확보 + 포화 관리라는 세 가지를 함께 제시해야 한다.

📢 섹션 요약 비유: 처리량 중심 운영은 계산대를 한 명에게 맡겨 초고속 계산을 기대하는 것이 아니라, 여러 계산대를 열고 줄이 끊기지 않게 관리하는 슈퍼마켓 운영과 같다. 다만 손님을 너무 몰아넣으면 줄이 길어져 모두가 답답해진다.

Ⅴ. 기대효과 및 결론

처리량을 중심으로 시스템을 설계하면 같은 시간에 더 많은 작업을 안정적으로 소화할 수 있다. 이는 서버 대수 대비 서비스 수용량 증가, 배치 완료 시간 단축, 자원 활용률 향상, 비용 대비 성능 개선으로 이어진다. 특히 멀티코어와 분산 시스템 시대에는 처리량이 곧 확장성의 언어라고 해도 과장이 아니다.

하지만 처리량이 높다는 사실만으로 좋은 시스템이라고 단정할 수는 없다. 과도한 큐 적재, 긴 꼬리 지연, 캐시 오염, 메모리 경합, 전력 증가가 함께 올 수 있기 때문이다. 따라서 처리량은 단독 지표가 아니라 응답 시간, 사용률, 실패율과 함께 읽어야 한다.

정리하면 처리량은 "시스템이 얼마나 바쁘게 일하는가"가 아니라, "그 바쁨이 실제 완료 결과로 얼마나 잘 이어지는가"를 묻는 지표다. 시험에서는 파이프라이닝·병렬화·병목 제거와 연결해 기억하면 좋고, 실무에서는 포화되기 직전의 안정 구간을 찾는 지표로 기억하는 것이 가장 정확하다.

📢 섹션 요약 비유: 처리량은 공장의 기계 소음 크기를 듣는 것이 아니라, 퇴근할 때 창고에 완제품 상자가 몇 개 쌓였는지 확인하는 일과 같다. 바쁘게만 돌아가고 결과물이 적다면, 그 시스템은 진짜로 잘 일한 것이 아니다.

📌 관련 개념 맵

개념	연결 포인트
응답 시간 (Response Time)	처리량을 높일수록 대기열이 길어져 악화될 수 있는 대표 상충 지표
파이프라이닝 (Pipelining)	동일 시간 동안 더 자주 결과를 배출하게 만드는 대표 처리량 향상 기법
대역폭 (Bandwidth)	데이터 이동량의 상한으로, 실제 처리량을 받쳐 주는 인프라 폭
멀티코어 (Multi-Core)	동시에 여러 작업을 진행해 전체 완료량을 늘리는 병렬 처리 기반
병목 (Bottleneck)	전체 시스템 처리량을 결정하는 가장 느린 구간

📈 관련 키워드 및 발전 흐름도

단일 작업 실행
    │
    ▼
응답 시간 (Response Time) 중심 최적화
    │
    ├─► 파이프라이닝 (Pipelining)
    │        │
    │        ▼
    │   CPU 내부 처리량 향상
    │
    └─► 멀티코어 (Multi-Core) · 병렬 처리
             │
             ▼
        서버·분산 시스템 전체 처리량 확장
             │
             ▼
   병목 분석 · 큐 관리 · 대역폭 (Bandwidth) 균형 설계

이 흐름은 성능 관심사가 "한 건의 속도"에서 "전체 완료량"으로 확장되고, 다시 시스템 전반의 병목 관리로 이어지는 과정을 보여준다.

👶 어린이를 위한 3줄 비유 설명

처리량은 빵집에서 빵 하나가 얼마나 빨리 구워지는지보다, 한 시간 동안 빵이 몇 개 나왔는지를 보는 거예요.
오븐 하나만 엄청 빠르게 쓰는 것보다, 반죽하고 굽고 포장하는 일을 잘 나눠서 계속 빵이 나오게 만드는 게 더 중요해요.
그런데 손님을 너무 많이 한꺼번에 받으면 줄이 너무 길어져서, 많이 만들면서도 너무 오래 기다리게 하지 않게 조절해야 해요.