7. 라그랑주 승수법 (Lagrange Multiplier) — 제약 최적화

핵심 인사이트 (3줄 요약)

본질: 라그랑주 승수법 (Lagrange Multiplier) 은 등호 제약 조건 g(x)=0 아래에서의 최적화를 무제약 최적화로 변환하는 기법 — 최적점에서 ∇f와 ∇g가 평행하다는 기하적 사실을 이용한다.

가치: KKT (Karush-Kuhn-Tucker) 조건으로 부등호 제약 일반화 → SVM의 마진 최대화, 포트폴리오 최적화, 최대 엔트로피 모델의 수학적 기반이 모두 여기서 출발한다.

판단 포인트: 쌍대 문제 (Dual Problem) 전환 — 원 문제의 변수가 많아도 지지 벡터(Support Vector) 수가 적으면 듀얼이 빠르다. SVM의 커널 트릭이 가능한 이유가 바로 듀얼 표현이다.

Ⅰ. 개요 및 필요성

제약 최적화 문제 (Constrained Optimization):

minimize   f(x)
subject to gᵢ(x) = 0    (등호 제약, i = 1,...,m)
           hⱼ(x) ≤ 0    (부등호 제약, j = 1,...,p)

왜 제약이 필요한가?

자원 제한 (예산 ≤ B)
물리적 제약 (에너지 보존, 확률 합 = 1)
설계 요구사항 (응력 ≤ 허용치)

📢 섹션 요약 비유: 제약 최적화는 "규칙 있는 최선 선택"이다 — 주어진 예산(제약) 안에서 만족도(목적함수)를 최대화하는 쇼핑이 바로 제약 최적화 문제다.

Ⅱ. 아키텍처 및 핵심 원리

라그랑지안 (Lagrangian) 구성

등호 제약 g(x) = 0에 대해:

L(x, λ) = f(x) - λ · g(x)

∂L/∂x = 0  →  ∇f(x) = λ · ∇g(x)    [∇f ∥ ∇g]
∂L/∂λ = 0  →  g(x) = 0               [제약 만족]

λ: 라그랑주 승수 (Lagrange Multiplier) — 제약을 1단위 완화할 때 목적 함수의 변화율.

기하적 해석

등고선 f(x) = c₁, c₂, c₃   제약 g(x) = 0 (파란 곡선)

             ╭─────────────────╮
            ╭───────────────────╮
           ╭─────────────────────╮
          ╭───────────────────────╮
          │                  ★ 최적점
──────────┼────────────────────────── g(x) = 0
          ╰───────────────────────╯

최적점 ★ 에서: ∇f와 ∇g가 평행 (접선 일치)
→ f의 등고선과 g(x)=0이 접하는 지점!

KKT (Karush-Kuhn-Tucker) 조건 — 부등호 제약 확장

minimize  f(x)
s.t.      gᵢ(x) = 0   (i = 1,...,m)
          hⱼ(x) ≤ 0   (j = 1,...,p)

KKT 조건 (필요충분 조건, 볼록 문제일 때):
  1. ∇f(x*) + Σᵢ λᵢ∇gᵢ(x*) + Σⱼ μⱼ∇hⱼ(x*) = 0   (정류 조건)
  2. gᵢ(x*) = 0   ∀i                                (등호 제약)
  3. hⱼ(x*) ≤ 0   ∀j                                (부등호 제약)
  4. μⱼ ≥ 0        ∀j                                (이중 가능 조건)
  5. μⱼ · hⱼ(x*) = 0   ∀j                           (상보 여유 조건)

상보 여유 조건: μⱼ > 0 ⟺ hⱼ(x*) = 0 (제약이 활성화됨)

📢 섹션 요약 비유: KKT 조건의 상보 여유는 "사용된 자원만 비용 부과"와 같다 — 제약이 활성화(h=0, 꽉 차있음)되었을 때만 그 제약에 가격(μ>0)이 붙는다.

Ⅲ. 비교 및 연결

SVM 듀얼 문제 유도

SVM 원 문제 (Primal):

min_{w,b}  ½‖w‖²
s.t.       yᵢ(wᵀxᵢ + b) ≥ 1    ∀i
           → hᵢ(w,b) = 1 - yᵢ(wᵀxᵢ + b) ≤ 0

라그랑지안:

L(w, b, α) = ½‖w‖² - Σᵢ αᵢ[yᵢ(wᵀxᵢ + b) - 1]

∂L/∂w = 0 → w = Σᵢ αᵢyᵢxᵢ (w는 지지 벡터의 선형 조합) ∂L/∂b = 0 → Σᵢ αᵢyᵢ = 0

듀얼 문제 (Dual) — αᵢ에 대한 최대화:

max_{α}  Σᵢ αᵢ - ½ Σᵢ Σⱼ αᵢαⱼyᵢyⱼ xᵢᵀxⱼ
s.t.     Σᵢ αᵢyᵢ = 0,  αᵢ ≥ 0

내적 xᵢᵀxⱼ → 커널 K(xᵢ, xⱼ)로 교체!  ← 커널 트릭 가능

KKT 상보 여유: αᵢ > 0인 샘플이 지지 벡터 (Support Vector).

최대 엔트로피와 라그랑주

특성 함수 fₖ에 대한 기대값 제약 E[fₖ] = c̃ₖ 하에서 최대 엔트로피 분포:

maximize   H(P) = -Σ P(x) log P(x)
s.t.       Σ P(x)·fₖ(x) = c̃ₖ   ∀k
           Σ P(x) = 1

→ 라그랑주 → Gibbs 분포: P(x) ∝ exp(Σ λₖ fₖ(x))
                         (로지스틱 회귀의 분포 형태와 동일!)

📢 섹션 요약 비유: SVM 듀얼의 지지 벡터는 "결정의 경계를 만드는 필수 증인"이다 — 무수히 많은 데이터 중 경계에서 딱 접하는 몇 개(αᵢ>0)만 결정 경계를 완전히 결정한다.

Ⅳ. 실무 적용 및 기술사 판단

포트폴리오 최적화 (Markowitz)

minimize  wᵀΣw   (포트폴리오 분산)
s.t.      μᵀw = r_target   (목표 수익률)
          1ᵀw = 1           (예산 = 1)

라그랑지안:
L = wᵀΣw - λ₁(μᵀw - r) - λ₂(1ᵀw - 1)

해석해: w* = Σ⁻¹(λ₁μ + λ₂1) (최적 포트폴리오 가중치)

신경망 제약 최적화 응용

딥러닝에서 제약이 있는 학습:

L2 정규화 = ‖w‖² ≤ c 제약 최적화의 라그랑지안 → λ‖w‖² 페널티
스펙트럼 정규화 = 각 레이어 가중치 행렬의 최대 특이값 ≤ 1
페어니스 제약 = 인구통계 집단 간 오류율 차이 ≤ ε

기술사 판단 포인트

"라그랑주 승수 λ의 의미는?" → 제약 완화 시 목적 함수 변화율 (Shadow Price, 경제학의 가격 해석)
"SVM에서 커널 트릭이 가능한 이유?" → 듀얼 문제에서 내적 xᵢᵀxⱼ만 나타나므로 고차원 매핑 없이 커널 대체 가능
"KKT 조건이 충분조건이 되는 경우?" → 볼록 최적화 (원 문제와 듀얼 강한 쌍대성 성립 시)

📢 섹션 요약 비유: 라그랑주 승수 λ는 "제약의 가격표"다 — 제약을 1단위 완화할 때 목적 함수가 얼마나 개선되는지, 그 한계 가치가 λ다.

Ⅴ. 기대효과 및 결론

라그랑주 승수법과 KKT 조건은 제약 최적화의 통일 언어다. 물리학(에너지 최소화), 경제학(효용 최대화), 머신러닝(SVM, 최대 엔트로피), 공학(설계 최적화) 모두 같은 수학 도구를 공유한다.

강한 쌍대성 (Strong Duality): 볼록 + Slater 조건 만족 → 원 문제와 듀얼 문제의 최적값 일치 → 쉬운 듀얼로 원 문제 해결 가능.

📢 섹션 요약 비유: 강한 쌍대성은 "두 가지 방법으로 같은 답"이다 — 어렵고 복잡한 원 문제(Primal)와, 변수가 다른 듀얼 문제(Dual)가 같은 최적값을 공유한다.

📌 관련 개념 맵

개념	수식	응용
라그랑지안	L = f - λg	등호 제약 최적화
KKT 조건	정류+가능+상보여유	부등호 제약 최적화
SVM 듀얼	max Σαᵢ - ½ΣαᵢαⱼyᵢyⱼK(xᵢ,xⱼ)	커널 SVM
지지 벡터	KKT 상보 여유: αᵢ>0	SVM 경계 결정
최대 엔트로피	Gibbs 분포	로지스틱 회귀

📈 관련 키워드 및 발전 흐름도

[무제약 최적화 (Unconstrained Optimization)]
    │
    ▼
[등식 제약 (Equality Constraint)]
    │
    ▼
[라그랑주 승수법 (Lagrange Multiplier)]
    │
    ▼
[KKT 조건 (Karush-Kuhn-Tucker Conditions)]
    │
    ▼
[볼록 최적화 (Convex Optimization)]
    │
    ▼
[SVM 최적화 (Support Vector Machine Optimization)]

제약 조건 하에서의 최적화 문제를 라그랑주 승수법으로 해결하고 기계 학습 최적화로 이어지는 흐름이다.

👶 어린이를 위한 3줄 비유 설명

라그랑주 승수법은 "규칙 속 최선 선택": 주어진 예산(제약) 안에서 가장 많이 살 수 있는 물건(최적값)을 찾는 수학적 방법.
지지 벡터는 "경계 위의 핵심 선수": 수천 명의 데이터 중 결정 경계를 실제로 정하는 것은 경계에 바로 붙어 있는 몇 개의 지지 벡터들뿐.
강한 쌍대성은 "두 길이 같은 목적지": 어렵고 구불구불한 길(원 문제)과 다른 지름길(듀얼)이 결국 같은 곳에 도착한다.