CXL (Compute Express Link), 메모리 풀링, 캐시 일관성, PCIe 5.0

출제 빈도: ★★★★★ | 난이도: ★★★★☆ | 예측: ☆2026 확실 예측 (HPC+AI 인프라 핵심)

답안.

Ⅰ. 개요

CXL(Compute Express Link)은 Intel이 주도하고 AMD, ARM, 삼성 등이 참여한 PCIe 기반 개방형 캐시 일관성 인터커넥트 표준으로, CPU와 GPU/가속기/메모리를 낮은 지연으로 연결하고 메모리 풀링(Memory Pooling)을 가능하게 한다. CXL 2.0부터 메모리 풀링, CXL 3.0부터 멀티 호스트 공유 메모리를 지원한다.

Ⅱ. 핵심 구성요소

I. CXL 정의 및 등장 배경
   - 기존 PCIe: 단방향, 캐시 일관성 미지원
   - CXL: PCIe 5.0 물리 계층 기반, 3개 프로토콜 계층
     * CXL.io   : PCIe 호환 I/O
     * CXL.cache: 가속기가 호스트 메모리 캐시
     * CXL.mem  : 호스트가 가속기 메모리 접근

II. CXL 디바이스 Type 분류
   | Type   | 구성              | 예시                    |
   |--------|------------------|------------------------|
   | Type 1 | 가속기 (캐시만)   | SmartNIC, DPU          |
   | Type 2 | 가속기 + 메모리   | GPU, AI 가속기          |
   | Type 3 | 메모리 전용       | CXL DRAM, Persistent M |

III. 메모리 풀링 (CXL 2.0+)
   
   [기존]                    [CXL 메모리 풀링]
   서버1: 256GB RAM          ┌─────────────────┐
   서버2: 256GB RAM          │  메모리 풀 (2TB) │
   (사용률 낮아도 공유 불가) │  CXL Fabric     │
                             └────┬──────┬─────┘
                             서버1│      │서버2
                             (필요│시 동적│할당)
   
   효과: 메모리 이용률 향상, LLM 서빙 용량 확장

IV. AI 인프라에서 CXL 적용
   - LLM 추론: 수백GB 모델 가중치 → CXL 메모리 풀에서 동적 로드
   - GPU 메모리 확장: GPU VRAM(80GB) + CXL DRAM(수TB)


해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.

### Ⅲ. 특징 및 비교

핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.

### Ⅳ. 적용 사례

실무 환경에서의 적용 사례와 기대효과를 제시한다.

### Ⅴ. 전망

최신 기술 동향과 향후 발전 방향을 서술한다.