013. ETH — 지수 시간 가설

핵심 인사이트

ETH(Exponential Time Hypothesis, 지수 시간 가설)는 "3-SAT는 2^o(n) 시간에 풀 수 없다"는 Russell Impagliazzo와 Ramamohan Paturi의 가설 — P≠NP를 가정하지 않고도 NP 문제의 하한선을 제시하는 더 강력한 조건부 복잡도 프레임워크다.

ETH와 SETH(Strong ETH)는 알고리즘의 최적성 증명에 활용 — "이 알고리즘이 이보다 빠를 수 없다"는 조건부 하한선 증명이 ETH를 가정하는 방식으로 이루어지며, 파라미터화 복잡도(Parameterized Complexity) 분야의 핵심 도구다.

ETH가 참이라면 NP-완전 문제는 지수 시간보다 빠른 알고리즘이 없음 — 이는 현재 알려진 SAT 알고리즘(DPLL, CDCL)의 최악 성능이 본질적이라는 것을 시사하며, "더 빠른 알고리즘 찾기"가 ETH 부정과 동치임을 의미한다.

Ⅰ. ETH 정의

ETH (Exponential Time Hypothesis):

배경:
  P ≠ NP는 여전히 미증명
  → NP 문제의 정확한 복잡도 미지수
  
  ETH: 더 구체적인 주장
  "k-SAT (k≥3) 문제는 2^o(n) 알고리즘이 존재하지 않는다"
  
  (o(n): n보다 작은 모든 함수, 즉 sublinear exponent)

3-SAT 최상 알고리즘:
  현재 최적: O(1.3071^n) (Hertli, 2014)
  
  이보다 더 빠른 O(c^n) (c < 2): 알려진 것 없음
  2^o(n): 더 작은 지수 = ETH가 부정하는 것

Sparsification Lemma:
  ETH와 동치인 변환
  
  임의의 k-SAT 인스턴스 (m개 절)
  → m = O(n) 절인 k-SAT 인스턴스로 변환
  → "희소한" 3-SAT도 어렵다
  
  결론: ETH는 3-SAT의 "가장 쉬운" 경우도 어렵다는 주장

SETH (Strong ETH):
  ETH의 강화 버전
  
  "k → ∞ 이면 k-SAT은 (2 - ε)^n 알고리즘 없다"
  (어떤 ε > 0에 대해서도)
  
  SETH → ETH (SETH가 더 강한 주장)
  SETH: 2-SAT조차 2^(1-ε)^n 불가?

📢 섹션 요약 비유: ETH는 미로 탈출 최소 시간 — "이 미로는 아무리 빠른 방법도 최소 2^n 스텝이 필요하다"는 주장. 증명은 못 했지만, 이걸 믿으면 더 빠른 알고리즘이 없다는 결론!

Ⅱ. ETH 기반 하한선 증명

조건부 하한선 (ETH 가정 하):

방법론:
  ETH 가정 하에서 "만약 이 문제를
  O(f(n)) 시간에 풀면 ETH 위반"임을 보임
  → 이 문제는 Ω(f(n)) 하한선 가짐

예 1: Dominating Set
  그래프 G의 지배 집합 크기 k 결정
  
  ETH 가정 하: n^o(k) 알고리즘 없음
  
  증명: 3-SAT → Dominating Set 변환
  3-SAT의 ETH 하한 → Dominating Set 하한 전달

예 2: k-Clique
  그래프에서 크기 k 클리크 존재 여부
  
  ETH 가정 하: n^o(k) 알고리즘 없음
  O(n^k) FPT 알고리즘이 사실상 최적임을 시사

예 3: 해밀턴 사이클
  ETH 가정 하: 2^o(n) 알고리즘 없음
  현재 O(2^n × n) Held-Karp DP = 사실상 최적

파라미터화 복잡도 (Parameterized Complexity):

FPT (Fixed-Parameter Tractable):
  f(k) × n^c 시간 알고리즘 존재
  k = 파라미터 (예: 해 크기)
  
  ETH 가정 하: 일부 FPT 알고리즘의
  f(k)가 단순 지수 2^k 이하가 불가능함을 증명
  
  ETH → FPT 알고리즘 최적성 근거

📢 섹션 요약 비유: ETH 하한선 증명은 벤치마크 측정 — "이 길은 최소 1시간 걸린다"를 증명하지 않고, "1시간보다 빠르면 ETH가 틀린다"고 논리적으로 보임. 조건부 증명!

Ⅲ. ETH와 SAT Solver

현실 SAT Solver와 ETH:

산업용 SAT Solver:
  DPLL (Davis-Putnam-Logemann-Loveland):
  1962년 제안
  백트래킹 기반 완전 알고리즘
  
  CDCL (Conflict-Driven Clause Learning):
  현대 SAT Solver의 핵심
  MiniSAT, Glucose, CaDiCaL 등
  
  실제 성능:
  수백만 변수 인스턴스 수초 내 해결
  But: 최악 케이스 = 지수 시간
  
ETH가 실무에 주는 시사점:

  1. 최악 케이스는 피할 수 없음:
  ETH가 참이면 모든 SAT Solver는
  최악 케이스에서 지수 시간
  → 실용적 인스턴스 구조 활용이 핵심
  
  2. 랜덤 SAT:
  무작위 3-SAT는 임계 비율에서 어려움
  m/n ≈ 4.267 (m=절 수, n=변수 수)
  → ETH 예측과 일치: 이 비율 근처가 최악
  
  3. 하드 인스턴스 회피:
  실제 EDA, AI Planning 문제는
  구조적 특성으로 "쉬운" 인스턴스
  → 휴리스틱+CDCL로 빠른 해결

응용:
  IC 설계 검증 (SAT 기반)
  계획 문제 (AI Planning)
  암호화 검증
  생물 정보학 (단백질 구조)

📢 섹션 요약 비유: ETH와 SAT Solver는 제한 속도 — ETH(이론적 제한) = 최악 케이스 지수 시간. 하지만 실제 도로(현실 인스턴스)는 구조적으로 빠른 길. 이론 최악 = 실제 최악 아님!

Ⅳ. SETH의 활용

SETH (Strong ETH) 활용:

SETH:
  k-SAT의 지수 밑(base)이 2에 가까워짐
  → 2-SAT만큼 어려운 문제가 많음을 시사

SETH 기반 하한선 예:

Edit Distance (편집 거리):
  두 문자열 최소 편집 거리
  현재: O(n²) DP 알고리즘
  
  SETH 가정 하: O(n^(2-ε)) 알고리즘 없음
  (Backurs & Indyk, 2015)
  
  → O(n²)이 실질적 최적임을 시사

LCS (Longest Common Subsequence):
  현재: O(n²)
  SETH 가정 하: O(n^(2-ε)) 불가
  
  → 문자열 알고리즘의 "이차 장벽(Quadratic Barrier)"

Orthogonal Vectors (OV):
  n개의 d-차원 불리언 벡터
  내적=0인 쌍 존재 여부
  
  SETH → OV: O(n^(2-ε)) 불가
  
  많은 그래프/문자열 문제가 OV로 환원 가능
  → SETH 기반 하한선의 핵심 중간 문제

의미:
  수십 년간 O(n²) 알고리즘만 존재하던 문제들
  → SETH 가정 하에서 이차 장벽이 본질적
  → "더 빠른 알고리즘 찾기" 사실상 SETH 부정과 동치

📢 섹션 요약 비유: SETH는 이차 장벽의 벽 — 편집 거리·LCS 알고리즘이 O(n²)보다 빠를 수 없다는 조건부 증명. SETH가 맞다면 수십 년간의 최적 알고리즘이 진짜 최적!

Ⅴ. 실무 시나리오 — ETH 기반 알고리즘 설계

ETH/SETH를 활용한 알고리즘 연구:

시나리오: 유전체 서열 비교 소프트웨어

문제:
  두 DNA 서열 (각 1억 bp) 편집 거리 계산
  O(n²) DP: 10^16 연산 → 수십 년
  
SETH 시사:
  O(n^(2-ε)) 알고리즘 없음 (SETH 가정 하)
  → 정확한 편집 거리 = 빠른 알고리즘 없음
  
실용적 해결:
  1. 근사 알고리즘:
  BLAST, BWA: 정확도 일부 포기
  O(n log n) 또는 더 빠른 근사
  
  2. 파라미터화:
  편집 거리 k로 파라미터화
  O(nk) 알고리즘
  → k가 작으면 (유사 서열) 빠름
  
  3. 구조 활용:
  실제 DNA: 긴 반복 구조
  → LZ 압축 + 압축 편집 거리
  → 압축 표현에서 직접 비교

ETH가 알려주는 것:
  "정확한 O(n^1.99) 알고리즘은 없다"
  → 근사/파라미터화/구조 활용 방향 제시
  → 알고리즘 연구의 방향성 결정

논문 기여 패턴:
  "알고리즘 X의 시간 복잡도는 SETH 가정 하에서
  O(n^(2-ε)) 불가능. 따라서 O(n²)이 최적에 가깝다."
  → 알고리즘 최적성의 조건부 증명

📢 섹션 요약 비유: ETH 기반 설계는 지도의 막다른 길 — "이 길은 더 빠를 수 없다(SETH 하한)"고 알면, 다른 길(근사/파라미터화/구조 활용)을 찾아요. 막다른 길을 알아야 우회로를 찾죠!

📌 관련 개념 맵

ETH (지수 시간 가설)
+-- 기반 개념
|   +-- k-SAT 복잡도
|   +-- Sparsification Lemma
+-- 강화 버전
|   +-- SETH (Strong ETH)
|   +-- W[1]-hard 이론
+-- 응용
|   +-- 조건부 하한선 증명
|   +-- 파라미터화 복잡도
|   +-- Edit Distance, LCS 하한
+-- 관련 문제
    +-- Orthogonal Vectors (OV)
    +-- k-Clique, Dominating Set

📈 관련 키워드 및 발전 흐름도

[P vs NP 미해결 (1971~)]
Cook-Levin 정리: SAT = NP-완전
      |
      v
[ETH 제안 (1999)]
Impagliazzo & Paturi
"k-SAT의 지수 하한"
      |
      v
[SETH 등장 (2001)]
Strong ETH: 더 강한 가설
      |
      v
[이차 장벽 발견 (2015~)]
Edit Distance SETH 하한
OV 중간 문제 체계화
      |
      v
[현재: 조건부 하한 주류화]
많은 문제의 최적성 증명
ETH/SETH 기반 연구 표준화

👶 어린이를 위한 3줄 비유 설명

ETH는 미로 최소 시간 보장 — "이 미로는 아무리 빠른 방법도 2^n 스텝 이상 필요해요(아직 증명 못 했지만)"라는 강한 믿음!
조건부 하한은 논리적 증명 — "ETH가 맞다면 이 알고리즘보다 빠른 것은 없어요"를 수학으로 보여줘요. 직접 증명 대신 논리로!
SETH는 더 강한 벽 — 편집 거리, LCS를 O(n²)보다 빠르게 풀면 SETH가 틀린다고 밝혀졌어요. 그래서 O(n²)이 사실상 최선!