388. 크로스바 스위치 (Crossbar Switch)

핵심 인사이트 (3줄 요약)

본질: 크로스바 스위치 (Crossbar Switch)는 입력과 출력을 격자 형태의 교차점으로 연결해, 서로 다른 목적지라면 동시에 1단계로 통신하게 만드는 대표적인 비차단 스위치 구조다.

가치: 공유 버스 (Shared Bus)의 직렬 병목을 없애고 총 대역폭을 크게 늘려, 짧고 예측 가능한 지연시간이 중요한 메모리 시스템·스위치 패브릭·소규모 다중 프로세서에 강하다.

판단 포인트: 성능은 뛰어나지만 교차점 수가 입력 수와 출력 수의 곱에 비례하므로, 노드 수가 커질수록 면적·배선·전력 비용이 급증해 대규모 시스템에서는 계층형 또는 다단 연결망으로 넘어간다.

Ⅰ. 개요 및 필요성

크로스바 스위치 (Crossbar Switch)는 N개의 입력과 M개의 출력을 행과 열로 배치하고, 각 교차점에 스위치를 두어 원하는 입력-출력 쌍을 직접 이어 주는 상호 연결 구조다. 핵심은 "모든 노드가 한 줄로 줄 서는가"가 아니라 "목적지만 다르면 동시에 지나갈 수 있는가"에 있다. 즉, 공유 버스처럼 한 번에 하나의 전송만 허용하는 구조와 달리, 서로 다른 출력으로 향하는 요청은 병렬로 흘려보낼 수 있다.

이 구조가 필요해진 배경은 병렬 처리 시스템에서 버스 경쟁이 너무 빨리 심해지기 때문이다. 프로세서 수가 늘어나면 연산 능력은 증가하지만, 데이터 이동이 한 통로에 묶이면 전체 성능은 가장 느린 통로에 갇힌다. 특히 다중 프로세서가 여러 메모리 뱅크에 동시에 접근하는 환경에서는, 통신 경로 자체의 병목을 제거해야 코어 추가 효과가 실제 처리량 증가로 이어진다.

아래 그림은 크로스바가 왜 "병렬 대역폭을 사서 얻는 구조"인지 보여준다.

┌──────────────────────────────────────────────────────────────────────────┐
│ 4x4 crossbar example                                                    │
├──────────┬────────┬────────┬────────┬────────┤
│          │ Out0   │ Out1   │ Out2   │ Out3   │
├──────────┼────────┼────────┼────────┼────────┤
│ In0      │ ON     │ OFF    │ OFF    │ OFF    │
│ In1      │ OFF    │ OFF    │ ON     │ OFF    │
│ In2      │ OFF    │ ON     │ OFF    │ OFF    │
│ In3      │ OFF    │ OFF    │ OFF    │ ON     │
└──────────┴────────┴────────┴────────┴────────┘

Different outputs  => parallel transfers possible
Same output target => arbitration required

이 그림에서 중요한 점은 모든 입력이 항상 동시에 전송하는 것이 아니라, 출력이 겹치지 않을 때 병렬성이 최대화된다는 사실이다. 따라서 크로스바는 "무조건 충돌이 없다"기보다 "내부 경로 때문에 막히지 않는다"는 의미의 비차단 (Non-blocking) 특성을 가진다. 남는 충돌은 경로가 아니라 동일 자원 경쟁, 즉 같은 메모리 뱅크나 같은 출력 포트를 동시에 원할 때 발생한다.

📢 섹션 요약 비유: 공유 버스가 톨게이트 하나로 모든 차가 줄 서는 도로라면, 크로스바는 각 차가 원하는 출구로 바로 갈 수 있게 교차로마다 전용 차선을 깔아 둔 입체 교통망과 같다.

Ⅱ. 아키텍처 및 핵심 원리

크로스바의 성능은 단순히 선을 많이 깔아서가 아니라, 각 교차점에서 연결 여부를 즉시 결정할 수 있기 때문에 나온다. 입력 포트는 요청을 내고, 제어기 또는 중재기 (Arbiter)는 어떤 입력이 어떤 출력과 연결될지 결정하며, 교차점 스위치는 그 순간 필요한 경로만 닫아 전기적으로 통하게 만든다. 이 덕분에 통상 지연시간은 1단 스위칭에 가깝고, 동시에 여러 쌍을 처리할 수 있다.

구성 요소	역할	성능 영향	설계 시 주의점
입력 포트 (Input Port)	요청·데이터를 스위치 매트릭스로 전달	요청량이 많을수록 중재 빈도 증가	버퍼링 정책 필요
출력 포트 (Output Port)	최종 목적지로 데이터 전달	동일 출력 경쟁 시 병목 지점	출력별 대역폭 균형
교차점 (Crosspoint)	특정 입력과 특정 출력을 직접 연결	병렬 연결 수를 결정	수가 `N x M`으로 증가
중재기 (Arbiter)	동일 출력 요청 충돌 해결	공정성과 지연에 직접 영향	우선순위·기아 방지 필요

아래 그림은 크로스바의 내부 판단 흐름을 압축한다.

┌──────────────┐     ┌──────────────────────────────┐     ┌──────────────┐
│ Input ports  │ ─▶  │ Crosspoint matrix            │ ─▶  │ Output ports │
│ In0 In1 In2  │     │ + arbitration / scheduling   │     │ O0 O1 O2 O3  │
│ In3          │     │                              │     │              │
└──────────────┘     └──────────────────────────────┘     └──────────────┘
                            │
                            ├─ Different outputs  -> connect in parallel
                            └─ Same output target -> choose one, defer others

정량적으로 보면 장점과 한계가 아주 분명하다. N x N 크로스바는 최대 N개의 독립 전송을 동시에 처리할 수 있어 총 대역폭이 매우 크다. 반면 필요한 교차점 수와 배선 자원도 O(N^2)로 커지므로, 노드가 두 배가 되면 스위치와 배선 부담은 네 배 수준으로 증가한다. 그래서 소규모에서는 이상적이지만, 대규모에서는 배선 길이, 신호 지연, 소비전력, 칩 면적이 빠르게 부담이 된다.

실제로는 메모리 뱅크 인터리빙, 캐시 코히어런시 트래픽, 패킷 스위치 내부 패브릭처럼 짧은 지연과 높은 동시성이 필요한 지점에 선택적으로 쓰인다. 다시 말해 크로스바는 시스템 전체를 덮는 만능 구조라기보다, 가장 병목이 치명적인 심장부에 배치하는 고성능 구조에 가깝다.

📢 섹션 요약 비유: 크로스바는 대형 호텔의 자동 배정 시스템과 비슷하다. 빈 객실이 여러 개면 손님들을 동시에 바로 배정할 수 있지만, 모두가 같은 스위트룸 하나만 원하면 결국 프런트가 순서를 정해야 한다.

Ⅲ. 비교 및 연결

크로스바를 제대로 이해하려면 공유 버스, 메시 (Mesh), 다단 연결망 (Multistage Interconnection Network)과의 경계를 함께 봐야 한다. 크로스바는 지연과 병목 측면에서는 매우 매력적이지만, 확장 비용 면에서는 가장 공격적인 구조다. 즉, "빠르고 단순한 경로"와 "커질수록 감당 가능한 구조" 사이에서 어디에 서 있는지 이해해야 한다.

항목	공유 버스 (Shared Bus)	크로스바 스위치 (Crossbar Switch)	다단 연결망 (Multistage Interconnection Network)
동시 전송 수	사실상 1개	최대 `N`개	다수 가능, 내부 충돌 가능
내부 경로 길이	짧지만 대기 큼	매우 짧음, 보통 1단	여러 단계 경유
비용/면적	낮음	매우 높음	중간
확장성	낮음	중간 이하	높음
대표 용도	소형 단순 시스템	고성능 메모리/스위치 패브릭	대형 병렬 시스템/네트워크

공유 버스와 비교하면 크로스바의 본질은 "대기열 제거"다. 버스는 물리 경로가 하나라 입력이 늘어날수록 평균 대기시간이 빠르게 증가한다. 반면 크로스바는 출력이 다르기만 하면 동시 전송이 가능하므로, 병렬 작업이 실제 성능 향상으로 이어질 가능성이 크다.

다단 연결망과 비교하면 차이는 반대편에서 드러난다. 다단 연결망은 작은 스위치를 여러 층으로 쌓아 비용을 줄이는 대신, 여러 단계의 지연과 내부 충돌 가능성을 받아들인다. 크로스바는 그 타협을 거부하고 한 번에 연결하는 대신, 배선과 면적 비용을 직접 지불하는 구조다. 따라서 노드 수가 커질수록 크로스바 단독 구조는 비현실적이 되고, 계층형 크로스바나 클로스 망 (Clos Network) 같은 절충안으로 발전한다.

이 개념은 칩 내부 네트워크에도 연결된다. 소규모 대칭형 다중 처리기 (SMP, Symmetric Multiprocessing)나 스위치 칩 내부 패브릭에서는 크로스바가 여전히 유효하지만, 코어 수가 크게 늘어난 네트워크 온 칩 (NoC, Network on Chip)에서는 메시나 링이 더 자주 선택된다. 이유는 명확하다. 온칩 배선 길이와 면적까지 고려하면, 크로스바의 이상적인 짧은 지연보다 현실적인 확장성이 더 중요해지기 때문이다.

📢 섹션 요약 비유: 크로스바는 소수 VIP를 위해 방마다 전용 엘리베이터를 둔 건물이고, 다단 연결망은 엘리베이터를 환승하게 만들어 비용을 줄인 대형 복합몰이다.

Ⅳ. 실무 적용 및 기술사 판단

실무에서 크로스바를 볼 때 가장 중요한 질문은 "이 시스템의 병목은 어디이며, 그 병목을 없애기 위해 면적과 비용을 얼마나 지불할 가치가 있는가"다. 예를 들어 고성능 네트워크 스위치나 라우터의 내부 스위치 패브릭은 많은 포트가 동시에 다른 포트로 패킷을 보내야 하므로, 크로스바의 짧은 지연과 높은 동시성이 직접적인 가치가 된다. 반면 수백 개 노드가 연결되는 대규모 병렬 시스템 전체를 순수 크로스바로 구성하는 것은 비용·전력·배선 측면에서 거의 항상 비합리적이다.

특히 다중 프로세서 메모리 구조에서는 비균일 메모리 접근 (NUMA, Non-Uniform Memory Access)과 연결해 판단해야 한다. 소켓 수가 적고 메모리 접근 지연의 예측 가능성이 중요한 서버라면 크로스바 또는 그에 가까운 완전 연결 구조가 유리하다. 하지만 소켓과 가속기가 많아질수록 완전 연결보다 계층형 인터커넥트가 현실적인 선택이 된다.

설계 판단 체크리스트

서로 다른 출력으로의 동시 요청이 매우 빈번한가?
평균 처리량보다 최악 지연시간과 지연 편차가 더 중요한가?
노드 수가 작아 O(N^2) 비용을 감당할 수 있는가?
동일 출력 경쟁을 조절할 중재 정책이 충분히 설계되었는가?

피해야 할 안티패턴

"병렬 시스템이니까 무조건 크로스바가 최고"라고 단정하는 설계
실제 트래픽은 소수 목적지에 집중되는데 내부 패브릭만 크게 키우는 설계
배선, 발열, 검증 비용을 무시하고 이론적 대역폭만으로 선택하는 판단

기술사 답안 관점에서는 "크로스바는 비차단이지만 무료가 아니다"라는 문장을 기억하면 좋다. 즉, 같은 출력 충돌은 여전히 존재하고, 가장 큰 한계는 성능이 아니라 비용과 확장성이다. 그래서 작은 시스템에서는 최적, 큰 시스템에서는 부분 적용 또는 계층화가 정답이 되는 경우가 많다.

📢 섹션 요약 비유: 크로스바 도입 판단은 행사장에 전용 출입문을 몇 개 만들지 정하는 일과 같다. VIP 몇 명의 빠른 입장이 중요하면 효과적이지만, 관객 수만 계속 늘어나면 문보다 건물 구조부터 다시 설계해야 한다.

Ⅴ. 기대효과 및 결론

크로스바 스위치를 적절한 규모에 적용하면 시스템은 높은 총 대역폭과 예측 가능한 짧은 지연시간을 얻는다. 이는 메모리 병렬 접근, 패킷 스위칭, 고성능 입출력 경로처럼 "통신이 성능을 결정하는 구간"에서 특히 큰 효과를 낸다. 다시 말해 크로스바의 진짜 가치는 CPU를 더 빠르게 만드는 것이 아니라, 이미 있는 연산 자원이 통신 대기 때문에 놀지 않게 만드는 데 있다.

하지만 전제조건도 분명하다. 노드가 커질수록 교차점 수, 제어 복잡도, 배선 밀도, 소비전력이 함께 증가하므로, 크로스바는 확장성의 끝이 아니라 고성능의 출발점에 가깝다. 그래서 현대 시스템은 순수 크로스바를 무한 확장하기보다, 부분 크로스바·계층형 스위치·광 스위치 패브릭처럼 필요한 곳에만 직접 연결성을 보강하는 방향으로 진화한다.

결국 크로스바는 "가장 빠른 연결"의 상징이 아니라, 비용을 써서 병목의 위치를 지우는 구조로 기억하는 것이 맞다. 작은 규모에서는 거의 이상적이지만, 규모가 커질수록 그 이상성 자체가 가장 비싼 제약이 된다.

📢 섹션 요약 비유: 크로스바는 모든 방을 복도로 바로 잇는 궁전 설계다. 방 수가 적을 때는 이동이 가장 빠르지만, 방이 도시처럼 늘어나면 궁전이 아니라 도시계획이 필요해진다.

📌 관련 개념 맵

개념	연결 포인트
상호 연결망 (Interconnection Network)	크로스바는 병렬 시스템의 대표적인 동적 상호 연결 구조다.
공유 버스 (Shared Bus)	크로스바가 해결하려는 직접적인 병목 대상이다.
다단 연결망 (Multistage Interconnection Network)	크로스바의 비용 문제를 줄이기 위해 등장한 절충 구조다.
메시 (Mesh)	대규모 온칩·병렬 시스템에서 크로스바 대신 자주 선택되는 확장형 토폴로지다.
스위치 패브릭 (Switch Fabric)	네트워크 장비 내부에서 크로스바 개념이 실제 구현되는 대표 영역이다.

📈 관련 키워드 및 발전 흐름도

공유 버스 병목
    │
    ▼
크로스바 스위치 (Crossbar Switch)
    │
    ├─ 짧은 지연 · 높은 동시성
    │
    ▼
다단 연결망 (Multistage Interconnection Network)
    │
    ▼
클로스 망 (Clos Network) · 스위치 패브릭 (Switch Fabric)
    │
    ▼
네트워크 온 칩 (NoC, Network on Chip) · 계층형 인터커넥트

이 흐름은 "단일 경로 병목 제거 → 직접 연결 극대화 → 비용 절충 → 대규모 계층화"로 인터커넥트 설계가 발전하는 방향을 보여준다.

👶 어린이를 위한 3줄 비유 설명

크로스바 스위치는 여러 친구가 여러 방으로 동시에 들어가고 싶을 때, 방마다 바로 이어지는 문을 많이 만들어 둔 집이에요.
그래서 가려는 방이 서로 다르면 기다리지 않고 한꺼번에 움직일 수 있어요.
하지만 방이 너무 많아지면 문을 만들 돈과 공간이 너무 많이 들어서, 큰 건물에서는 다른 길 찾기 방법을 같이 써야 해요.