814. iWARP - TCP/IP 기반의 RDMA 구현 망 호환성 중시 프로토콜
핵심 인사이트: 앞서 배운 RoCE(813번)는 기존 이더넷(랜선) 망에서 굴러가긴 했지만, 치명적인 단점이 하나 있었다. 이더넷 스위치들이 패킷을 절대 바닥에 버리지 않도록 특수한 고급 세팅(PFC, Lossless)을 무조건 해줘야만 했다. 네트워크 관리자들은 불평했다. "스위치 설정 바꾸기 귀찮아! 그냥 우리가 평소에 맨날 쓰는 완전 평범한 TCP/IP 인터넷 망에서, 아무 설정도 안 건드리고 그냥 랜카드만 꽂으면 곧바로 RDMA 속도가 터지게 할 순 없어?" 극강의 보편적 호환성을 타겟으로 인텔(Intel) 등이 밀어붙인 또 다른 대안, 그것이 iWARP다.
Ⅰ. iWARP (Internet Wide Area RDMA Protocol)의 개념
- 개념: 별도의 무결손(Lossless) 이더넷 스위치 환경을 억지로 구축할 필요 없이, 우리가 일상적으로 쓰는 전통적인 TCP/IP 프로토콜의 표준 동작 방식 그대로 위에서 RDMA (원격 직접 메모리 접근) 기능과 커널 우회 기술을 구현해 내는 네트워크 프로토콜입니다. (IETF 표준)
Ⅱ. RoCE v2와 iWARP의 결정적 동작 방식 차이 🌟
목적은 "이더넷 위에서 RDMA를 쓰자"로 똑같지만, 뼈대가 완전히 다릅니다.
1. RoCE v2 (UDP 기반의 쾌속, 하지만 까탈스러움)
- RoCE v2는 TCP 대신 가벼운 UDP(포트 4791) 껍데기를 씁니다. 가벼우니까 속도는 미친 듯이 빠릅니다.
- 하지만 UDP는 패킷이 길가다 사라져도 책임지지 않습니다. 그래서 네트워크 스위치 장비들에게 "너네 절대 내 패킷 땅에 버리지 마!"라고 강제하는 비싸고 까탈스러운 설정(PFC/ECN)을 데이터센터 전체에 세팅해야만 합니다.
2. iWARP (TCP 기반의 듬직함, 극한의 호환성) 🌟
- iWARP는 우리가 아는 그 무겁고 듬직한 TCP(Transmission Control Protocol) 껍데기를 씁니다.
- TCP는 본질적으로 '신뢰성' 보장 프로토콜입니다. 인터넷 가다가 패킷이 땅에 떨어져(Drop) 사라지면? TCP 자체가 폰에서 다시 쏘라고(재전송) 알아서 완벽하게 커버를 쳐줍니다.
- 결과 (호환성 극대화): 데이터센터의 이더넷 스위치에 그 어떤 특수 설정(PFC 등 무결손 세팅)을 할 필요가 단 1도 없습니다. 그냥 용산에서 산 만원짜리 싸구려 스위치를 써도, iWARP 랜카드(RNIC)만 꽂으면 인터넷(WAN)을 넘나들며 완벽하게 RDMA 통신이 성립합니다. 전산실 아저씨들이 가장 편해하는 기술입니다.
Ⅲ. iWARP의 트레이드오프 (왜 대세가 되지 못했나?)
- 호환성은 최고지만, TCP는 태생적으로 너무 무겁고 복잡합니다.
- iWARP 랜카드(하드웨어 칩셋)가 이 복잡한 TCP 패킷을 다 포장하고 에러 처리를 하려다 보니(TCP Offload Engine, TOE), 칩셋의 설계가 미친 듯이 복잡해지고 단가가 비싸졌습니다.
- 반면 RoCE v2는 칩셋 만들기가 쉽고, 속도(Latency) 면에서 iWARP보다 조금 더 빠릅니다. 결국 현재 AI 클라우드 인프라의 거대한 대세 패권(엔비디아 주도)은 RoCE v2가 가져갔고, iWARP는 일부 스토리지 망(마이크로소프트 진영) 등에서 제한적으로 쓰이고 있습니다.
📢 섹션 요약 비유: RDMA라는 VIP 손님을 모시는 두 가지 방법이 있습니다. RoCE v2는 VIP를 모시기 위해 도로의 신호등 시스템 전체를 VIP 전용(PFC 무결손 설정)으로 다 뜯어고쳐야 하는 '도로 통제형 에스코트'입니다. 인프라 공사는 힘들지만 일단 길을 통제해 놨으니 속도는 광속입니다. 반면 iWARP는 도로의 신호등을 전혀 안 건드리고 그냥 평범한 꽉 막힌 출퇴근 도로(일반 TCP/IP 망)를 그대로 씁니다. 대신 VIP 손님이 직접 탱크처럼 크고 튼튼한 장갑차(TCP 재전송과 복잡한 RNIC 하드웨어)를 타고 무식하게 목적지까지 뚫고 가는 방식입니다. 도로 공사(스위치 세팅)가 필요 없어 극도로 편리하지만, 장갑차가 무거워서 최고 속도는 살짝 떨어지는 든든한 호환성 전술입니다.