741. 버퍼 오버플로우 공격 스택 (Buffer Overflow Attack Stack)

핵심 인사이트 (3줄 요약)

본질: 버퍼 오버플로우 (Buffer Overflow)는 프로그램이 할당된 메모리 공간(버퍼)의 경계를 넘어 데이터를 쓸 때 발생하는 취약점으로, 주로 스택 (Stack) 영역의 함수 리턴 주소 (Return Address)를 악의적으로 덮어쓰는 데 사용된다.

가치: C/C++ 언어의 태생적 한계(문자열 경계 검사 부재)를 노린 가장 고전적이고 치명적인 원격 코드 실행(RCE) 기법으로, 현대 시스템의 보안 방어 기술(ASLR, DEP/NX)을 발전시킨 핵심 원동력이다.

융합: 운영체제의 프로세스 주소 공간 레이아웃, CPU의 레지스터 (EIP/RIP, ESP, EBP) 제어 메커니즘, 그리고 가상 메모리 보호 기법이 총망라된 주제로, 악성코드 동작의 0순위 진입점(Entry Point)이다.

Ⅰ. 개요 및 필요성

개념: 메모리 버퍼에 할당된 용량보다 더 큰 데이터를 입력받을 때, 인접한 메모리 영역을 덮어쓰는 (Overwrite) 현상. 이 중 **스택 기반 버퍼 오버플로우 (Stack-based Buffer Overflow)**는 함수 호출 시 생성되는 스택 프레임(Stack Frame)의 제어 데이터를 조작하여 프로그램의 실행 흐름을 해커가 원하는 코드로 돌리는 공격이다.
필요성(문제의식):
- strcpy, gets, sprintf 같은 표준 C 라이브러리 함수들은 입력 데이터의 길이를 검사하지 않고 널 바이트(\0)가 나올 때까지 무작정 메모리에 복사한다.
- 이로 인해, 해커가 의도적으로 긴 문자열을 입력하면, 함수가 끝난 후 CPU가 되돌아갈 '이전 주소(Return Address)'가 해커의 데이터로 덮어씌워져 버린다.
- 서랍장(스택)에 옷(데이터)을 넣을 때, 서랍이 꽉 차면 멈춰야 하는데 계속 욱여넣어서 밑 칸에 들어있던 '부모님의 중요 서류(리턴 주소)'까지 밀어내고 덮어버리는 것과 같다.
- 서랍을 닫고 다시 열었을 때, 원래 있던 서류 대신 해커가 끼워 넣은 '은행 송금 지시서(쉘코드)'가 실행되는 셈이다.
등장 배경:
- 1988년 모리스 웜(Morris Worm)이 fingerd의 gets() 버퍼 오버플로우를 악용해 인터넷을 마비시키면서 세상에 알려졌다.
- 1996년 Aleph One이 발표한 "Smashing The Stack For Fun And Profit" 문서는 스택 오버플로우 공격을 체계적으로 공식화하여 보안 업계에 엄청난 파장을 일으켰다.

  ┌─────────────────────────────────────────────────────────────┐
  │                 메모리 스택 오버플로우 발생 원리도                   │
  ├─────────────────────────────────────────────────────────────┤
  │                                                             │
  │   [정상적인 스택 프레임 구조] (높은 주소 -> 낮은 주소 방향으로 자람) │
  │   ──────────────────────────────────────────────            │
  │   │ 함수의 매개변수 (Arguments)                     │            │
  │   ├────────────────────────────────────────────┤            │
  │   │ 리턴 주소 (Return Address / EIP)            │ ◀ 핵심 타겟 │
  │   ├────────────────────────────────────────────┤            │
  │   │ 이전 프레임 포인터 (Saved EBP)                 │            │
  │   ├────────────────────────────────────────────┤            │
  │   │ 지역 변수 버퍼 (예: char buffer[8])           │            │
  │   ──────────────────────────────────────────────            │
  │                                                             │
  │   [공격자가 16바이트 이상의 데이터를 입력할 경우]                   │
  │   ──────────────────────────────────────────────            │
  │   │ 함수의 매개변수 (Arguments)                     │            │
  │   ├────────────────────────────────────────────┤            │
  │   │ [해커의 주소] (리턴 주소가 덮어씌워짐!)           │ ◀ 오버플로우│
  │   ├────────────────────────────────────────────┤            │
  │   │ [해커의 데이터] (AAAA...)                    │ ◀ 오버플로우│
  │   ├────────────────────────────────────────────┤            │
  │   │ [해커의 데이터] (AAAA...)                    │ ◀ 지역 변수 │
  │   ──────────────────────────────────────────────            │
  └─────────────────────────────────────────────────────────────┘

[다이어그램 해설] 인텔 x86 아키텍처에서 스택은 높은 주소에서 낮은 주소로 성장(Grow down)하지만, 버퍼에 데이터를 쓸 때는 낮은 주소에서 높은 주소 방향으로(Grow up) 기록된다. 이 엇갈린 방향성이 비극의 원인이다. 8바이트 버퍼에 "AAAAAAAAAAAAAAAA"(16바이트)를 입력하면, 8바이트는 정상적으로 버퍼에 들어가지만 나머지 8바이트는 위쪽(높은 주소)에 위치한 Saved EBP와 리턴 주소(Return Address)를 무자비하게 덮어쓴다. 함수가 ret (Return) 명령어를 실행할 때 CPU는 오염된 리턴 주소를 꺼내서 그곳으로 점프(EIP 변경)해 버린다.

📢 섹션 요약 비유: 안내 데스크(지역 변수)에서 방문객 명단(버퍼)을 받는데, 방문객이 명단 종이 밖으로 글씨를 계속 넘겨 적어서 데스크 뒤에 붙어있던 '사장님 직통 전화번호(리턴 주소)'까지 해커의 번호로 덮어쓰는 것과 같습니다.

Ⅱ. 아키텍처 및 핵심 원리

버퍼 오버플로우 공격의 핵심 구성 요소

성공적인 원격 코드 실행(RCE)을 위해서는 단순히 에러를 내서 프로그램을 죽이는(Crash) 것을 넘어, 해커가 원하는 코드를 꽂아 넣고 그곳으로 점프해야 한다.

요소명	역할	내부 동작	기술적 세부 사항
취약점 트리거 함수	오버플로우를 발생시키는 진입점	입력 길이를 제한하지 않는 함수 호출	C언어의 `gets()`, `strcpy()`, `strcat()` 등
페이로드 (Payload)	취약한 버퍼를 채우고 리턴 주소를 덮어쓰기 위해 조작된 데이터 덩어리	버퍼 크기 파악 $\rightarrow$ NOP + 쉘코드 + 조작된 리턴 주소 조합	쓰레기 값(Dummy)과 실행 코드가 혼합됨
쉘코드 (Shellcode)	공격자가 궁극적으로 실행하고자 하는 기계어 코드 조각	리눅스의 `/bin/sh`를 띄우거나 백도어 포트를 여는 시스템 콜 호출	널 바이트(`\x00`)가 없는 기계어 (함수 종료 방지)
NOP Sled (노프 썰매)	정확한 쉘코드 시작 주소를 맞추기 어려운 점을 보완하는 미끄럼틀	No Operation(`0x90`) 명령어를 연속 배치해 CPU가 쉘코드까지 미끄러져 내려가게 함	주소 예측의 오차 범위 (Jitter) 극복

공격 파이프라인 (Execution Flow)

  ┌───────────────────────────────────────────────────────────────────┐
  │                 버퍼 오버플로우 페이로드 주입 및 실행 시퀀스              │
  ├───────────────────────────────────────────────────────────────────┤
  │                                                                   │
  │  [메모리 상의 공격 페이로드 구조]                                        │
  │                                                                   │
  │  낮은 주소                                                높은 주소 │
  │  [버퍼 시작] ────────────────────────────────────────── [리턴 주소] │
  │  ┌───────────────┬──────────────────────────┬────────┬──────────┐ │
  │  │ NOP Sled      │ Shellcode                │ Dummy  │ 조작된 RET │ │
  │  │ (\x90\x90...) │ (/bin/sh 실행 기계어)      │ (AAAA) │ 0xbffff... │ │
  │  └───────────────┴──────────────────────────┴────────┴──────────┘ │
  │      ▲                                                    │       │
  │      │ ① CPU가 조작된 RET를 읽고 NOP Sled 어딘가로 점프함            │       │
  │      └────────────────────────────────────────────────────┘       │
  │                                                                   │
  │  ② NOP(\x90)은 아무 동작도 안 하므로 CPU는 계속 다음 명령어로 미끄러짐       │
  │  ③ 미끄러지다가 쉘코드를 만나면 쉘코드를 강제 실행함 (해커가 시스템 장악!)     │
  └───────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 해커는 취약한 애플리케이션에 페이로드를 전송한다. 페이로드의 끝부분에는 스택의 특정 주소(NOP Sled의 중간쯤)를 가리키는 4바이트 주소(RET)가 들어있다. 버퍼가 넘치면서 이 주소가 정상 리턴 주소를 덮어쓴다. 취약한 함수가 종료될 때, CPU는 자기가 해커의 주소로 점프한다는 사실도 모른 채 EIP(명령어 포인터)를 해당 주소로 바꾼다. CPU가 착지한 곳에는 NOP(0x90)이 깔려있어 미끄러지듯 쉘코드에 도달하고, 루트 쉘(Root Shell)이 뜨면서 서버는 해커의 손에 넘어간다.

📢 섹션 요약 비유: 얼음 빙판(NOP Sled) 끝에 덫(Shellcode)을 설치해 두고, 안내 표지판(리턴 주소)의 방향을 빙판 쪽으로 몰래 돌려놓아, 희생자가 표지판을 보고 걷다가 주르륵 미끄러져 덫에 빠지게 만드는 치밀한 함정입니다.

Ⅲ. 비교 및 연결

메모리 보호 기법 (Mitigation) 비교

오버플로우 공격에 맞서 운영체제와 컴파일러는 방패를 진화시켜 왔다. 해커의 공격(창)과 OS의 방어(방패) 간의 군비 경쟁이다.

방어 기술	개념	원리 및 방식	해커의 우회 기법
Stack Canary (스택 카나리아)	스택 훼손 1차 탐지 (컴파일러 레벨)	버퍼와 EBP/RET 사이에 난수(Canary) 삽입. 함수 종료 시 난수가 변조됐는지 검사.	정보 유출(Information Leak) 취약점을 이용해 카나리아 값을 미리 알아내어 페이로드에 끼워 넣음.
DEP / NX Bit (데이터 실행 방지)	스택 코드 실행 원천 차단 (HW+OS)	스택이나 힙 영역의 메모리에 '실행 불가(No eXecute)' 비트를 걸어 쉘코드가 실행되지 못하게 막음.	ROP (Return-Oriented Programming): 스택에 코드를 넣지 않고, 이미 실행 권한이 있는 라이브러리(libc)의 코드 조각(Gadget)들을 연결해 실행함.
ASLR (주소 공간 무작위화)	쉘코드 주소 예측 불가 (OS 레벨)	프로그램 실행 시마다 스택, 힙, 라이브러리(libc)의 메모리 로딩 주소를 랜덤하게 바꿈.	NOP Sled 크기 극대화, 힙 스프레이(Heap Spraying), 베이스 주소 릭(Leak).

과목 융합 관점

컴퓨터 구조 (CA): 오버플로우의 본질은 "폰 노이만 아키텍처"의 약점(데이터와 명령어가 같은 메모리 공간을 공유함)에 기인한다. CPU는 읽어 들인 바이너리가 정상 코드인지, 해커가 버퍼에 쓴 데이터(쉘코드)인지 구분하지 못한다. 이를 막기 위해 나온 하드웨어적 하버드 아키텍처 흉내가 NX Bit(데이터 실행 방지)다.
프로그래밍 (C/C++): 현대의 Rust나 Go, Java 같은 언어는 메모리 안전성(Memory Safety)을 언어 차원에서 보장하여, 컴파일러가 배열의 경계를 벗어나는 접근(Out-of-bounds)을 원천 차단하므로 버퍼 오버플로우 자체가 불가능하다.
📢 섹션 요약 비유: 카나리아(경보기)로 도둑의 접근을 감지하고, DEP(무장 해제)로 도둑이 들고 온 무기를 못 쓰게 만들며, ASLR(미로 설계)로 집안의 구조를 매일 바꿔버려 도둑이 길을 잃게 만드는 3중 방어막입니다.

Ⅳ. 실무 적용 및 기술사 판단

실무 시나리오 및 시큐어 코딩

시나리오 — 레거시 C 시스템의 원격 코드 실행 취약점: 금융권의 오래된 C언어 기반 TCP 소켓 서버에서 해커가 조작된 패킷을 보내 서버를 크래시시키거나 원격 쉘을 탈취하는 정황이 포착됨.
- 원인 분석: 코드 분석 결과 패킷의 헤더 파싱 부에서 strcpy(dest, src)를 사용 중이었음. 해커가 src 길이를 극단적으로 길게 조작한 패킷을 보냄.
- 아키텍트 판단 (시큐어 코딩): 길이 제어가 없는 위험 함수를 모두 퇴출시킨다. strcpy $\rightarrow$ strncpy 또는 strlcpy로, sprintf $\rightarrow$ snprintf로 전면 교체하여 목적지 버퍼의 sizeof()를 넘는 데이터는 잘라버리도록(Truncate) 소스코드를 리팩토링한다.
시나리오 — ROP (Return-Oriented Programming) 공격 대응: 서버에 ASLR과 DEP 보호 기법이 모두 켜져 있음에도 불구하고 해커가 공유 라이브러리(libc) 내부에 이미 존재하는 코드 조각(Gadget)들의 끝부분(ret)만을 체인처럼 엮어 system("/bin/sh")를 실행시키는 고급 우회 공격(ROP)을 성공시켰다.
- 아키텍트 판단 (컴파일러 및 커널 방어 강화): ROP를 막기 위해서는 제어 흐름 무결성 (CFI, Control Flow Integrity) 기술을 도입해야 한다. 최신 컴파일러(Clang/GCC)의 CFI 옵션을 켜서, 함수 호출이나 리턴 시 사전에 컴파일러가 정의한 유효한 흐름(Call Graph) 밖으로 벗어나는 비정상적인 간접 점프(Indirect Jump)를 커널이 탐지하고 프로세스를 강제 종료하도록 설정한다.

  ┌───────────────────────────────────────────────────────────────────┐
  │                 안전한 C 프로그래밍 (Secure Coding) 의사결정 트리         │
  ├───────────────────────────────────────────────────────────────────┤
  │                                                                   │
  │   [문자열 처리/메모리 복사 함수 선택]                                    │
  │                │                                                  │
  │                ▼                                                  │
  │      입력 데이터의 길이를 사전에 명확히 알 수 있는가?                       │
  │          ├─ 예 ─────▶ [메모리 복사 함수 허용]                        │
  │          │            `memcpy()` 사용 (단, 길이는 목적지 버퍼 이하로 강제) │
  │          └─ 아니오 (사용자 입력, 네트워크 패킷 등)                      │
  │                │                                                  │
  │                ▼                                                  │
  │      사용 중인 라이브러리가 길이 제한(Boundary Check)을 지원하는가?          │
  │          ├──▶ 지원함: `strncpy()`, `snprintf()`, `fgets()` 필수 사용 │
  │          └──▶ 안함:  즉시 금지! (`gets`, `strcpy`, `strcat`, `scanf`)  │
  │                                                                   │
  │   ※ 최후의 방어: 컴파일 시 `-fstack-protector` (Canary) 옵션 활성화 필수 │
  └───────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 이 의사결정 트리는 개발자가 소스 코드를 작성할 때 반드시 거쳐야 하는 보안 게이트다. "위험 함수를 쓰지 마라"는 선언적 가이드보다, "사용자 입력은 무조건 길이를 자르는 버전을 써라"는 구체적 규칙이 필요하다. 또한, 사람이 하는 실수를 커버하기 위해 빌드 파이프라인(CI/CD)에 스택 프로텍터 플래그를 강제로 삽입하여 개발자가 빼먹더라도 컴파일러가 카나리아를 심도록 아키텍처를 강제해야 한다.

안티패턴

strncpy의 함정: strncpy는 길이를 제한하여 버퍼 오버플로우는 막아주지만, 잘라낸 문자열 끝에 널 바이트(\0)를 자동으로 붙여주지 않는 경우가 있어, 이 문자열을 출력할 때 다시 메모리 누수(Information Leak)가 터지는 2차 사고를 유발한다. 따라서 복사 후 수동으로 dest[sizeof(dest)-1] = '\0'; 처리를 하는 것이 안전하다.
📢 섹션 요약 비유: 서랍장에 물건을 넣기 전에, 서랍의 "최대 크기 자"를 가져와서 튀어나오는 부분은 가위로 무조건 잘라내 버리는(Boundary Check) 아주 차갑고 기계적인 검수 과정입니다.

Ⅴ. 기대효과 및 결론

정량/정성 기대효과

구분	방어 기법 미적용 (Legacy)	복합 방어 기법 적용 (ASLR+DEP+Canary)	개선 효과
정량 (Exploit 난이도)	공격 스크립트 작성 시간 1시간 이내	ROP 체인 구성 및 주소 유출 기법 필요	해킹 시도 비용 및 난이도 수백 배 상승
정성 (시스템 생존율)	오버플로우 발생 시 즉각적인 Root 권한 탈취	오버플로우 시 프로세스 강제 종료(Crash)로 끝남	침해(Compromise)를 가용성 장애(DoS)로 방어
정성 (개발 문화)	취약점 패치에 급급한 사후 대응	컴파일 및 언어 차원의 시큐어 코딩	보안 내재화(Security by Design) 정착

미래 전망

메모리 안전 언어(Rust)로의 전환: 마이크로소프트, 구글, 리눅스 커널 진영 등 빅테크 기업들은 더 이상 C/C++의 메모리 취약점을 땜질하는 데 지쳐, OS의 핵심 모듈을 Rust로 재작성(Rewrite)하는 프로젝트를 국가 안보 차원에서 진행하고 있다.
하드웨어 기반 보안 (PAC): ARM v8.3 아키텍처부터 도입된 포인터 인증 코드(PAC, Pointer Authentication Code)는 리턴 주소를 하드웨어 암호화 키로 서명하여 스택에 저장한다. 공격자가 주소를 변조하더라도 서명을 맞출 수 없어 ROP와 스택 오버플로우를 CPU 칩 레벨에서 원천적으로 틀어막는 미래 기술이다.

참고 표준

CERT C Coding Standard: 안전한 C 언어 코딩 보안 가이드라인
MITRE CWE-119: 메모리 버퍼의 범위를 벗어난 연산 (Improper Restriction of Operations within the Bounds of a Memory Buffer)

버퍼 오버플로우는 단순한 코딩 실수가 아니라, "성능"을 위해 "안전"을 희생했던 70년대 C 언어 설계 철학의 빚을 50년째 갚고 있는 컴퓨터 공학의 원죄다. 이 빚을 청산하기 위해 운영체제는 수많은 메모리 보호 기법을 겹겹이 두르게 되었고, 현대의 방어 체계는 이제 소프트웨어를 넘어 하드웨어 칩(MMU, PAC) 레벨의 영역으로 진입했다.

📢 섹션 요약 비유: 예전에는 목수의 손재주(코딩 실력)에만 의존해 부서지지 않는 의자를 만들었다면, 미래에는 절대 부서지지 않는 강철 나무(Rust 언어, 하드웨어 보호)를 재료로 사용하여 원초적인 사고를 막아내는 방향으로 발전하고 있습니다.

📌 관련 개념 맵

개념	연결 포인트
접근 제어 목록 (ACL)	현재 개념으로 들어오기 전에 함께 이해하면 경계가 선명해지는 기반 개념이다.
보호 도메인 최소 권한 원칙	현재 개념이 등장하게 만든 직접적인 선행 흐름이다.
스푸핑, 백도어 악성코드	현재 개념이 구현·세분화될 때 바로 연결되는 후속 개념이다.
가상화 하이퍼바이저	확장 학습이나 심화 비교로 이어지는 다음 단계의 키워드다.

📈 관련 키워드 및 발전 흐름도

[보호 도메인 최소 권한 원칙]
    │
    ▼
[버퍼 오버플로우 공격 스택 (Buffer Overflow Attack Stack)]
    │
    ├──▶ [스푸핑, 백도어 악성코드]
    └──▶ [가상화 하이퍼바이저]

이 흐름도는 선행 개념에서 현재 개념으로 넘어온 뒤, 구현 세분화와 후속 확장으로 이어지는 학습 순서를 압축해 보여준다.

👶 어린이를 위한 3줄 비유 설명

컵(버퍼)에 물(데이터)을 부을 때, 컵의 크기보다 더 많은 물을 부으면 물이 흘러넘쳐서 옆에 있던 중요한 숙제(리턴 주소)를 적셔버리는 게 '버퍼 오버플로우'예요.
나쁜 해커들은 일부러 물을 콸콸 부어서 숙제를 망가뜨리고, 그 자리에 '컴퓨터 조종 리모컨(쉘코드)'을 몰래 올려놔서 컴퓨터를 맘대로 조종해요.
그래서 똑똑한 컴퓨터 기술자들은 컵에 눈금을 긋고 선을 넘으면 물통을 잠가버리는 기술(시큐어 코딩, DEP)을 만들어서 컴퓨터를 안전하게 지키고 있답니다!