774. 부채널 공격 - 캐시 타이밍 공격

핵심 인사이트 (3줄 요약)

본질: 캐시 타이밍 공격 (Cache Timing Attack)은 데이터를 직접 읽지 않고도 캐시 hit/miss 때문에 생기는 미세한 지연 차이에서 비밀 값을 추론하는 대표적인 부채널 공격 (Side-channel Attack)이다.

가치: 캐시는 성능 최적화 장치일 뿐인데도, 프로세스·코어·가상 머신이 공유하는 마이크로아키텍처 흔적을 남기므로 암호 구현과 클라우드 격리 모델을 동시에 위협한다.

판단 포인트: 방어의 핵심은 비밀에 따라 메모리 접근이 달라지지 않게 만드는 상수 시간 구현 (Constant-time Implementation)과, 공유 캐시·고해상도 타이머·공유 페이지를 최소화하는 플랫폼 설계다.

Ⅰ. 개요 및 필요성

캐시 타이밍 공격 (Cache Timing Attack)은 부채널 공격의 한 종류로, 데이터 자체가 아니라 데이터를 꺼내는 데 걸린 시간을 관찰해 비밀을 추론하는 기법이다. CPU (Central Processing Unit)와 DRAM (Dynamic Random Access Memory) 사이의 속도 차이를 줄이기 위해 만든 캐시 계층이, 역으로 “무엇을 읽었는지”를 시간으로 말해 주는 셈이다.

이 공격이 성립하는 핵심은 알고리즘이 아니라 구현이다. AES (Advanced Encryption Standard)의 테이블 조회, RSA (Rivest-Shamir-Adleman) 지수 연산의 분기, lookup table 기반 코드처럼 비밀 값이 접근 주소를 바꾸면, 수학적으로 안전한 알고리즘도 실제 시스템에서는 시간을 통해 정보를 흘릴 수 있다. 특히 멀티코어와 클라우드 환경에서는 LLC (Last-Level Cache) 공유 때문에 프로세스나 가상 머신 (Virtual Machine, VM) 경계를 넘는 누출까지 가능하다.

┌──────────────────────────────────────────────────────────────┐
│ Cache hierarchy turns latency into information              │
├──────────────────────────────────────────────────────────────┤
│ L1 hit   :   ~4 cycles                                      │
│ L2 hit   :  ~12 cycles                                      │
│ L3 hit   :  ~40+ cycles                                     │
│ DRAM     : 150~300+ cycles                                  │
│ => secret-dependent access pattern becomes measurable       │
└──────────────────────────────────────────────────────────────┘

이 차이는 평소엔 성능 최적화지만, 공격자에게는 관측 가능한 신호다. 따라서 “빠르게 만들었다”는 사실만으로도 새로운 공격면이 생길 수 있다.

📢 섹션 요약 비유: 캐시 타이밍 공격은 친구가 문제를 풀 때 쉬운 문제면 바로 답하고 어려우면 오래 생각하는 시간을 보고, 머릿속에 무엇이 있었는지 맞히는 것과 같다.

Ⅱ. 아키텍처 및 핵심 원리

캐시 타이밍 공격은 결국 네 단계로 요약된다. 캐시 상태를 준비하고, 피해자가 비밀 연산을 수행하게 만들고, 시간이 달라진 주소나 세트를 측정하고, 통계적으로 비밀과 상관관계를 찾는 것이다. 여기서 중요한 것은 캐시 라인 (Cache Line), 세트 연관성 (Set Associativity), LLC, 그리고 고해상도 타이머다.

요소	의미	누출 이유
캐시 라인 (Cache Line)	보통 64B 단위 전송	어느 라인이 적재됐는지로 접근 범위를 좁힘
캐시 세트 (Cache Set)	여러 라인이 경쟁하는 자리	경쟁·축출 여부가 관측 가능
LLC (Last-Level Cache)	코어 간 마지막 공유 캐시	다른 프로세스·VM과 충돌 가능
타이머 (TSC 등)	수십 cycle 차이 측정	hit/miss를 분리
lookup table	비밀 의존 주소 선택	키 비트가 접근 패턴으로 새어 나감

┌──────────────────────────────────────────────────────────────┐
│ Secret -> address choice -> cache state -> latency          │
├──────────────────────────────────────────────────────────────┤
│ secret bit                                                  │
│    │                                                        │
│    ▼                                                        │
│ table index / branch target                                 │
│    │                                                        │
│    ▼                                                        │
│ cache line hit or miss                                      │
│    │                                                        │
│    ▼                                                        │
│ measured time -> statistical inference                      │
└──────────────────────────────────────────────────────────────┘

예를 들어 AES의 테이블 기반 구현은 평문과 키의 조합이 다른 캐시 라인을 만지게 만들 수 있다. 공격자는 같은 연산을 수천 번 반복 측정해 어떤 라인이나 세트가 더 자주 hit 되었는지 분석하고, 그 편향으로 키 후보를 줄여 나간다. 즉 한 번의 측정보다 반복 측정에서 드러나는 패턴이 핵심이다.

📢 섹션 요약 비유: 캐시 타이밍 공격은 도서관 사서가 어느 책장을 자주 왔다 갔다 하는지 발걸음 시간으로 보는 것과 같다. 책 제목을 못 봐도 어느 분야를 찾았는지는 짐작할 수 있다.

Ⅲ. 비교 및 연결

캐시 타이밍 공격은 하나의 단일 기법이 아니라 관측 방식이 다른 계열이다. 따라서 세부 기법의 전제 조건과 해상도를 구분해야 실무 판단이 선명해진다.

기법	핵심 전제	해상도	특징
Prime+Probe	공유 캐시만 있으면 됨	세트 단위	범용적이지만 통계 부담 큼
Flush+Reload	공유 페이지 + `clflush` 가능	라인 단위	매우 정밀하고 노이즈가 적음
Evict+Time	전체 실행 시간 측정 가능	함수/연산 시간 단위	환경 제약은 적지만 해상도 낮음

또한 이 공격은 투기 실행 취약점과도 연결된다. Spectre류 공격은 투기적으로 읽은 비밀 값을 그대로 반환하지 못하므로, 마지막 단계에서 캐시 타이밍을 이용해 “어느 라인이 흔적을 남겼는지”를 읽어낸다. 즉 캐시 타이밍은 단독 공격이면서 동시에 다른 마이크로아키텍처 공격의 추출 채널이기도 하다.

📢 섹션 요약 비유: Prime+Probe가 “누가 내 주차칸을 썼는지”를 보는 것이라면, Flush+Reload는 “내가 지운 발자국이 다시 생겼는지”를 보는 것이다. 둘 다 흔적을 읽지만 관찰 방식이 다르다.

Ⅳ. 실무 적용 및 기술사 판단

실무 대응의 핵심은 캐시를 없애는 것이 아니라 비밀이 캐시 상태를 바꾸지 못하게 만드는 것이다. 가장 강력한 대응은 상수 시간 구현과 하드웨어 가속 사용이다. 예를 들어 AES-NI (Advanced Encryption Standard New Instructions)처럼 테이블 접근 대신 전용 명령을 쓰면 캐시 기반 누출을 크게 줄일 수 있다.

방어 우선순위

소프트웨어: secret-dependent branch와 table lookup 제거, bitslicing, constant-time library 사용
운영체제: SMT (Simultaneous Multithreading) 분리, 페이지 컬러링, 고해상도 타이머 제한
하드웨어: CAT (Cache Allocation Technology) 같은 캐시 파티셔닝, 보안 코어 분리
플랫폼 설정: 메모리 중복 제거(KSM) 비활성화, 민감 워크로드의 코어 고정

안티패턴

키 값을 인덱스로 직접 쓰는 테이블 기반 암호 구현
서로 다른 신뢰 영역의 프로세스를 같은 LLC와 SMT sibling에 함께 배치
“타이머만 막으면 끝난다”는 가정

체크리스트

민감한 코드가 constant-time 검증을 통과했는가?
보안 워크로드가 공유 캐시와 공유 스레드 정책에서 격리되는가?
성능 최적화를 위해 켠 KSM, dedup, huge page가 공격면을 넓히지 않는가?
하드웨어 가속 명령 사용 여부를 라이브러리 수준에서 강제하고 있는가?
📢 섹션 요약 비유: 캐시 타이밍 방어는 비밀 문서를 숨기는 것만이 아니라, 문서를 꺼낼 때 나는 발소리까지 일정하게 만드는 일과 같다.

Ⅴ. 기대효과 및 결론

캐시 타이밍 공격을 고려한 설계는 암호 모듈만 안전하게 만드는 것이 아니라, 클라우드 스케줄링·라이브러리 선택·하드웨어 배치까지 포함한 플랫폼 보안을 한 단계 끌어올린다. 특히 멀티테넌트 환경에서는 “기능이 맞게 동작한다”는 기준만으로는 충분하지 않고, “다르게 동작하는 시간이 남에게 보이지 않는다”는 기준까지 필요하다.

물론 완전한 제거는 쉽지 않다. 캐시는 성능의 핵심이므로 무조건 비우거나 끄면 비용이 너무 크다. 따라서 앞으로의 방향은 secure cache partitioning이나 constant-time 친화 컴파일러처럼 정보 흐름을 설계 단계에서 차단하는 아키텍처를 늘리는 것이다. 기억해야 할 핵심은 하나다. 캐시 타이밍 공격은 성능 최적화가 보안 관점에선 관측 채널이 될 수 있음을 보여준다.

📢 섹션 요약 비유: 좋은 방어는 집 안을 조용히 만드는 것이 아니라, 누가 어떤 방에 들어가도 복도에서 들리는 소리가 똑같게 만드는 집 구조와 같다.

📌 관련 개념 맵

개념	연결 포인트
캐시 라인 (Cache Line)	관측 최소 단위로 hit/miss가 시간 차이를 만듦
세트 연관성 (Set Associativity)	Prime+Probe의 자원 경쟁 구조를 결정
LLC (Last-Level Cache)	프로세스·코어 간 공유로 공격 범위를 넓힘
Constant-time	비밀 의존 접근을 없애는 핵심 방어 철학
AES-NI	테이블 접근을 줄여 캐시 누출을 완화하는 하드웨어 가속
Spectre	캐시 타이밍을 데이터 추출 채널로 활용하는 대표 사례

📈 관련 키워드 및 발전 흐름도

CPU-DRAM 속도 격차
  │
  ▼
캐시 계층 구조
  │
  ▼
Hit / Miss 지연 차이
  │
  ▼
Secret-dependent Access
  │
  ▼
Prime+Probe · Flush+Reload · Evict+Time
  │
  ▼
Constant-time · Cache Isolation

이 흐름은 “성능 최적화 → 시간 차이 → 정보 누출 → 구조적 방어”로 이어지는 캐시 타이밍 공격의 본질을 보여준다.

👶 어린이를 위한 3줄 비유 설명

친구가 장난감을 바로 찾으면 가까운 서랍에 있었다는 뜻이고, 오래 걸리면 먼 창고에 있었다는 뜻이에요.
나쁜 사람은 이 시간 차이만 보고 친구가 어떤 장난감을 찾았는지 맞히려고 해요.
그래서 중요한 컴퓨터는 어떤 장난감을 찾든 항상 비슷한 시간에 움직이도록 만들어야 해요.