194. 3-주소 명령어 — Brain Science

핵심 인사이트 (3줄 요약)

본질: 3-주소 명령어(Three-Address Instruction)는 명령어 포맷 안에 데이터를 가리키는 주소 필드가 3개(Source 2개, Destination 1개) 존재하는 가장 이상적이고 완전한 형태의 명령어다.

가치: C = A + B처럼 연산 과정에서 원본 데이터(A, B)가 전혀 파괴되지 않아 레지스터를 재사용하기 매우 좋으며, 컴파일러가 코드를 최적화하기 가장 편안한 환경을 제공한다.

융합: ARM, MIPS, RISC-V 등 현대 RISC 아키텍처의 절대적인 표준 포맷으로 융합되어, 고정 길이 명령어(Fixed-length)와 슈퍼스칼라(Superscalar) 병렬 처리의 물리적 토대가 되었다.

Ⅰ. 개요 및 필요성 (Context & Necessity)

개념: 3-주소 명령어(Three-Address Instruction)는 명령어 포맷 안에 연산 대상인 두 개의 소스(Source) 주소와 결과를 담을 한 개의 목적지(Destination) 주소를 모두 독립적으로 명시하는 형식이다. C = A + B와 같이 연산 과정에서 원본 데이터가 보존되는 '비파괴적(Non-destructive)' 구조를 갖는다.
필요성: 3-주소 명령어는 현대 고성능 CPU의 핵심 기술인 명령어 수준의 병렬성(ILP)을 극대화하기 위해 반드시 필요하다. 연산 후에도 입력 레지스터의 값이 보존되므로, 컴파일러가 데이터 파괴에 대한 걱정 없이 명령어의 순서를 자유롭게 뒤섞는 **명령어 스케줄링(Instruction Scheduling)**을 수행하여 파이프라인 정체(Stall)를 최소화할 수 있기 때문이다. 또한, 모든 명령어의 길이를 고정(32비트)함으로써 디코딩 회로를 극도로 단순화하여 단위 클럭당 처리 속도를 비약적으로 향상시키며, 이는 ARM이나 RISC-V와 같은 현대적 아키텍처가 전성비(Watt per Performance)를 사수하면서도 기가헤르츠급 초고속 연산을 달성하게 만드는 논리적 뼈대가 된다.
💡 비유: 3-주소 명령어는 '표준 레시피'와 같다. "밀가루(A)와 계란(B)을 섞어서, 오븐용 새 그릇(C)에 담아라." 밀가루 봉지와 계란 껍데기는 그대로 남아있고, 완성된 반죽은 완전히 새로운 그릇에 담기니 주방(레지스터)이 아주 깔끔하게 유지되어 다음 요리를 즉시 시작할 수 있는 것과 같다.

  ┌──────────────────────────────────────────────────────────────────────────────┐
  │         3-주소 명령어(Three-Address)의 비파괴적(Non-Destructive) 연산        │
  ├──────────────────────────────────────────────────────────────────────────────┤
  │                                                                              │
  │   [ 명령어 ] : ADD R3, R1, R2   ( "R3 ◀─ R1 + R2" )                          │
  │                                                                              │
  │   [ 연산 전 ]               [ 연산기(ALU) ]          [ 연산 후 ]             │
  │     R1 : [ 10 ]  ──┐                                R1 : [ 10 ]              │
  │                    ├────▶ [ 10 + 20 ] ──(새로 쓰기)─▶ R3 : [ 30 ]            │
  │     R2 : [ 20 ]  ──┘                                R2 : [ 20 ]              │
  │                                                                              │
  │ * 마법: 연산이 끝난 후에도 R1과 R2의 원본 데이터가 그대로 살아있다!          │
  │   ──▶ "지긋지긋한 복사(MOV) 명령어의 늪에서 탈출하다"                        │
  └──────────────────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 3-주소 명령어의 핵심 철학은 **'비파괴(Non-Destructive)'**다. 두 개의 입력(Source) 레지스터는 오직 읽기(Read)만 수행되고, 결과는 완전히 다른 제3의 목적지(Destination) 레지스터에 쓰인다. 이 덕분에 R1이나 R2의 값을 바로 다음 줄의 또 다른 연산에 재활용할 수 있어, 레지스터의 활용 효율이 극대화된다.

📢 섹션 요약 비유: 3-주소 명령어의 비파괴 연산은 '복사기에 원본 넣기'와 같습니다. 원본 서류(A, B)를 복사기에 넣고 돌리면 완전히 새로운 복사본(C)이 나오지만, 원본 서류는 털끝 하나 다치지 않고 그대로 남아있어 나중에 또 쓸 수 있는 것과 같습니다.

Ⅱ. 아키텍처 및 핵심 원리 (Deep Dive)

구성 요소 (RISC 파이프라인을 지탱하는 4대 필드)

3-주소 명령어는 일반적으로 32비트(4바이트)의 고정된 크기 안에 모든 것을 질서 정연하게 쑤셔 넣는다.

구성 요소	물리적 역할	아키텍처적 가치	비유
Opcode	수행할 연산의 종류 (ADD, SUB)	6~8비트 할당. 명령어의 종류 결정	요리법 지정
Destination (Rd)	결과값이 저장될 목적지 레지스터	5비트 할당(32개 레지스터용). Write 타겟	완성된 요리를 담을 접시
Source 1 (Rn)	첫 번째 피연산자 레지스터	5비트 할당. ALU의 왼쪽 입력	첫 번째 재료
Source 2 (Rm)	두 번째 피연산자 (레지스터 or 상수)	5비트(또는 더 긴 상수). ALU의 오른쪽 입력	두 번째 재료 또는 조미료

심층 동작 원리: "식(Expression) 처리의 극단적 단축"

3-주소 명령어로 Y = (A + B) * C 를 풀면 그 어떤 아키텍처보다 짧은 '줄 수'를 자랑한다.

  ┌───────────────────────────────────────────────────────────────────────────┐
  │         3-주소 명령어로 수식 "Y = (A + B) * C" 풀기                       │
  ├───────────────────────────────────────────────────────────────────────────┤
  │                                                                           │
  │   1. ADD R1, A, B  ──▶ (R1 ◀─ A + B) : A와 B를 더해 R1에 쓴다.            │
  │   2. MUL Y, R1, C  ──▶ (Y ◀─ R1 * C) : R1과 C를 곱해 Y에 쓴다.            │
  │                                                                           │
  │ * 마법: 단 2줄의 명령어로 복잡한 수식이 끝났다! 0-주소나 2-주소의         │
  │   절반도 안 되는 압도적인 명령어 '개수' 다이어트의 승리다.                │
  └───────────────────────────────────────────────────────────────────────────┘

[다이어그램 해설] (참고: 위 예시는 메모리 연산이 가능함을 가정한 논리적 수식이다. 실제 순수 RISC에서는 A, B, C를 로드하는 명령어가 선행되어야 한다.) 3-주소 머신은 수식을 짤 때 변수 복사(MOV)나 스택 조작(PUSH/POP) 같은 **'쓸데없는 낭비 동작(Overhead)'**이 전혀 없다. 연산 명령어 자체가 수학 공식의 모양과 완벽하게 일치하기 때문이다. 프로그래머나 컴파일러가 수식을 기계어로 번역할 때 가장 편안함을 느끼는 직관적인 포맷이다.

📢 섹션 요약 비유: 3-주소 연산은 '만능 자판기'와 같습니다. 동전(A) 넣고 버튼(B) 누르면 바로 음료수(Y)가 툭 튀어나옵니다. 중간에 다른 컵을 씻거나 돈을 거슬러 받는 등 쓸데없는 준비 과정이 아예 생략된 직관적인 구조입니다.

Ⅲ. 융합 비교 및 다각도 분석

심층 기술 비교: 3-주소 명령어의 득과 실

가장 우아한 명령어지만, 물리적 메모리 공간 앞에서는 대가가 따른다.

비교 항목	2-주소 명령어 (CISC)	3-주소 명령어 (RISC)	아키텍처 판단 포인트
레지스터 보존	원본 1개 파괴됨	원본 모두 100% 보존됨	레지스터 재사용 효율성
프로그램 줄 수	김 (MOV 명령어 남발)	짧음 (수식당 명령어 1개 배정)	명령어 인출(Fetch) 횟수
명령어 1개 폭(Size)	가변적 (평균 2~3바이트)	고정 4바이트 (상대적으로 뚱뚱함)	코드 밀도(Code Density) 저하
메모리 연산	`ADD R1, [M]` 허용	오직 레지스터 간 연산만 허용	Load/Store 아키텍처 강제
디코딩 난이도	지옥 (어디가 끝인지 모름)	천국 (항상 똑같은 자리에 주소가 있음)	파이프라인의 초고속화

과목 융합 관점

컴파일러 (Instruction Scheduling): 3-주소 명령어는 원본을 파괴하지 않으므로, 컴파일러가 명령어들의 '순서'를 제멋대로 뒤섞기(Scheduling) 너무 좋다. A와 B를 더하는 명령어가 C와 D를 더하는 명령어와 레지스터 이름이 겹칠 일이 없기 때문이다. 이 독립성 덕분에 파이프라인 스톨(Stall)을 줄이는 아웃오브오더(OoO) 실행의 효율이 극대화된다.
마이크로아키텍처 (Fixed-Length Decoding): 3-주소 명령어는 보통 32비트 고정 길이를 채택한다. CPU의 디코더는 명령어가 1바이트인지 5바이트인지 재볼 필요 없이, 무조건 4바이트씩 뚝뚝 끊어서 읽으면 된다. 이 '규격화된 명령어 융합' 덕분에 ARM 칩은 디코더를 아주 작고 싸게 만들 수 있었고, 이는 스마트폰 배터리 혁명의 일등 공신이 되었다.

  ┌─────────────────────────────────────────────────────────────────────────┐
  │         아키텍처의 모순: 3-주소의 비만(Code Bloat)과 Thumb 융합         │
  ├─────────────────────────────────────────────────────────────────────────┤
  │                                                                         │
  │   [ 문제 ] : 32비트 고정 길이를 쓰니까, 코드가 너무 뚱뚱해진다!         │
  │      `ADD R1, R2, R3` ─▶ 주소를 3개나 적으니 32비트가 꽉 참.            │
  │                                                                         │
  │   [ ARM의 천재적 해결책: Thumb 명령어 셋 융합 ]                         │
  │      "주소를 3개 다 쓰지 말고, 16비트짜리 2-주소 포맷을 섞어 쓰자!"     │
  │      ──▶ ARM 칩 내부에 32비트 모드와 16비트 모드를 스위칭하는 기술 도입 │
  │                                                                         │
  │ * 혁명: RISC(3-주소)의 스피드와 CISC(2-주소)의 압축률을 동시에 잡았다!  │
  └─────────────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 3-주소 명령어의 유일한 단점은 "너무 뚱뚱하다(Code Bloat)"는 것이다. 명령어 1개가 무조건 4바이트를 먹으니 메모리 용량이 금방 바닥나고 캐시 효율이 떨어진다. 이에 ARM 엔지니어들은 기존의 32비트 3-주소 체계에, 16비트로 압축된 2-주소 체계(Thumb)를 융합해 버렸다. 성능이 필요할 땐 3-주소로 돌고, 용량을 아껴야 할 땐 2-주소로 도는 이 완벽한 하이브리드 아키텍처가 전 세계 모바일 AP를 제패한 핵심 비결이다.

📢 섹션 요약 비유: 3-주소의 비만과 Thumb 융합은 '대형 SUV와 접이식 자전거' 같습니다. 3-주소(대형 SUV)는 힘도 세고 짐(주소 3개)도 많이 싣지만 기름(메모리)을 많이 먹습니다. 그래서 트렁크에 접이식 자전거(16비트 2-주소)를 싣고 다니다가, 골목길(메모리 부족 구간)에서는 자전거로 갈아타는 아주 똑똑한 주행 전략입니다.

Ⅳ. 실무 적용 및 기술사적 판단

실무 시나리오

시나리오 — 컴파일러 IR(Intermediate Representation) 설계: 상황: GCC나 LLVM 같은 현대 컴파일러가 C/C++ 소스코드를 파싱하여 기계어로 만들기 전 중간 언어를 만들어야 함. 판단: "소프트웨어 내부의 3-주소 머신 융합"이다. 소스코드가 x86(2-주소)에서 돌든 ARM(3-주소)에서 돌든 상관없이, 컴파일러는 일단 내부적으로 모든 코드를 SSA(Static Single Assignment) 기반의 3-주소 코드로 변환한다. t1 = a + b, t2 = t1 * c 처럼 원본을 파괴하지 않는 3-주소 포맷이 코드 최적화 알고리즘을 돌리기 가장 완벽한 수학적 구조이기 때문이다.
시나리오 — AVX-512 (벡터 연산) 확장의 3-주소 채택: 상황: 인텔 x86 칩에서 딥러닝 행렬을 한 번에 512비트씩 처리하는 새로운 명령어를 만들어야 함. 판단: "CISC 진영의 3-주소 백기 투항"이다. 인텔은 원래 2-주소(파괴적 연산)의 맹주지만, 512비트짜리 거대한 벡터 레지스터를 매번 MOV로 복사하는 것은 버스 대역폭의 자살 행위였다. 결국 인텔은 VEX 접두사(Prefix)를 융합하여, 겉은 x86이지만 속은 완벽한 3-주소 포맷을 갖춘 VADDPS ZMM1, ZMM2, ZMM3 명령어를 도입함으로써 RISC의 장점을 뼈저리게 인정했다.

  ┌──────────────────────────────────────────────────────────────────────────┐
  │         마이크로아키텍처 설계 시 레지스터 개수와 주소 비트 배분          │
  ├──────────────────────────────────────────────────────────────────────────┤
  │                                                                          │
  │   [ 32비트 명령어 안에 3개의 주소를 넣으려면 레지스터가 몇 개여야 할까? ]│
  │                │                                                         │
  │                ▼                                                         │
  │    만약 레지스터가 128개라면?                                            │
  │          ├─ 1개당 7비트 필요. 7비트 × 3개 = 21비트 소모!                 │
  │          └─ 남는 비트가 11개뿐이라 Opcode와 상수를 넣을 수 없음 (기각)   │
  │                │                                                         │
  │                ▼                                                         │
  │    만약 레지스터가 32개라면? (가장 완벽한 타협점)                        │
  │          ├─ 1개당 5비트 필요. 5비트 × 3개 = 15비트 소모!                 │
  │          └─ 17비트가 남아 Opcode(6비트)와 상수(11비트) 수용 가능 (채택)  │
  │                                                                          │
  │  최종 조치: 3-주소 아키텍처에서 레지스터 32개는 신이 내린 황금 비율이다! │
  └──────────────────────────────────────────────────────────────────────────┘

[다이어그램 해설] RISC 창시자인 데이비드 패터슨(David Patterson) 교수가 수천 번의 시뮬레이션을 통해 찾아낸 진리다. 3-주소 포맷은 주소 필드에 비트를 너무 많이 뺏기는 것이 숙명이다. 이 한정된 32비트 공간 안에서, 레지스터 개수(스필 방지)와 상수 크기(Immediate Value) 사이의 완벽한 밸런스를 잡은 숫자가 바로 **'32개의 범용 레지스터'**다. MIPS, ARM, RISC-V 등 지구상의 거의 모든 3-주소 RISC 칩이 레지스터를 정확히 32개만 가지는 물리적 이유가 바로 이 명령어 포맷의 한계 때문이다.

도입 체크리스트

Zero Register Hardwiring: 3-주소 명령어에서 0이라는 상수를 자주 쓰는데, 이를 위해 R0를 항상 0만 출력하는 '하드와이어드 제로 레지스터(Zero Register)'로 융합하여 명령어 공간을 아꼈는가? (예: ADD R1, R2, R0 ─▶ 데이터 복사 MOV 대용)
Immediate Value Encoding: 3번째 주소(Src2) 자리에 레지스터 번호(5비트) 대신, 짧은 상수 값(12비트 Immediate)을 직접 때려 넣을 수 있는 하드웨어 다중화 회로(Multiplexer)가 있는가?

안티패턴

3-주소 머신에서의 무분별한 메모리 덧셈 시도: C언어에서 *ptr += 10; 을 짰을 때, 컴파일러 옵션을 잘못 주어 이것이 한 줄의 기계어로 번역될 거라 착각하는 행위. 3-주소 RISC 머신은 Load/Store 구조가 강제되므로, 이 코드 한 줄은 무조건 LOAD, ADD, STORE 라는 3개의 명령어로 파편화되어 파이프라인을 3번 긁고 지나간다. 이를 인지하지 못하고 포인터 연산을 남발하면 극심한 성능 하락을 겪는다.
📢 섹션 요약 비유: RISC에서 메모리 연산을 시도하는 것은 '은행 창구에서 요리하기'와 같습니다. 은행(메모리)은 돈(데이터)을 찾고(Load) 맡기는(Store) 곳이지 요리(ADD)를 하는 곳이 아닙니다. 요리는 무조건 집 주방(레지스터)에 돈을 가져와서 해야 하는 엄격한 규칙이 있습니다.

Ⅴ. 기대효과 및 결론

정량/정성 기대효과

구분	2-주소 CISC 아키텍처	3-주소 RISC 아키텍처 융합	개선 효과
정량	원본 보호를 위해 빈번한 MOV 발생	연산과 동시에 원본 보존	레지스터 복사 오버헤드 90% 제거
정량	디코딩 시 가변 길이 해독 지연	고정 길이 병렬 디코딩	명령어 해독(ID) 속도 2~3배 향상
정성	하드웨어 내부에서 레지스터 이름 복잡하게 꼬임	3개의 독립적 주소로 꼬임 원천 방지	슈퍼스칼라(Superscalar) 설계 난이도 대폭 하락

미래 전망

4-주소, 5-주소의 FMA (Fused Multiply-Add) 확장: 인공지능 시대가 오면서 $D = A \times B + C$ 같은 연산을 한 클럭에 끝내는 FMA 명령어가 필수적이 되었다. 이를 위해 3-주소를 넘어 주소를 4개까지 명시하는 확장 명령어 포맷(예: ARM의 FMLA)이 현대 텐서(Tensor) 연산의 뼈대가 되고 있다.
가변 길이 RISC-V (C 확장): 3-주소의 단점인 뚱뚱한 코드 크기를 극복하기 위해, RISC-V는 기본 32비트 3-주소 포맷을 유지하면서도, 자주 쓰이는 명령어만 16비트 2-주소로 압축하는 '압축 명령어(C-Extension)' 융합 기술을 오픈소스 표준으로 확립했다.

참고 표준

ARM AArch64 / MIPS / RISC-V: 현대 IT 생태계를 양분하는 RISC 진영의 공통된 3-주소 기반 명령어 표준. 모바일과 임베디드는 이 포맷이 지배하고 있다.
LLVM IR / GCC GIMPLE: 지구상의 모든 프로그래밍 언어가 기계어로 변환되기 전 반드시 거쳐 가는, 완벽하게 정제된 3-주소 소프트웨어 중간 언어(IR) 포맷.

"명령어의 길이"라는 족쇄를 풀고 "레지스터의 자유"를 선언한, 현대 아키텍처의 가장 이성적인 완성작 '3-주소 명령어'의 진화 로드맵은 다음과 같다.

  ┌────────────────────────────────────────────────────────────────────────────────────────────┐
  │         완전무결: 3-주소 명령어(Three-Address) 진화 로드맵                                 │
  ├────────────────────────────────────────────────────────────────────────────────────────────┤
  │                                                                                            │
  │   [1단계: 메모리 절약의 굴레]  [2단계: RISC의 반란과 자유]  [3단계: FMA와 AI 텐서의 무기]  │
  │                                                                                            │
  │   길면 안 돼! 2-주소나 써라! ──▶ 길이 고정하고 3-주소 뚫자! ──▶ AI 가속을 위해 4-주소까지! │
  │  (파괴적 대입에 고통받던 시절)  (슈퍼스칼라의 시대를 열다)  (행렬 연산의 극한을 향해)      │
  │ "원본 지워진 거 어딨어?"      "A, B 더해서 C에 놔둬!"     "A*B 더하기 C를 D에 놔둬!"       │
  └────────────────────────────────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 컴퓨터 명령어 포맷 전쟁의 최종 승자다. 1단계: 메모리가 비싸던 시절엔 명령어가 뚱뚱해지는 3-주소는 사치로 여겨져 2-주소(x86)에 밀렸다. 2단계: 하지만 하드웨어 기술이 발전하며 '코드가 뚱뚱한 것보다, 파이프라인에서 데이터가 꼬이는 게 더 무섭다'는 것을 깨달은 공학자들은, 원본을 보존하는 3-주소 고정 길이 명령어(RISC)를 창조하여 스마트폰 시대를 열었다. 3단계: 이제 AI 시대를 맞아, 이 우아한 3-주소 포맷은 주소를 하나 더 늘려 FMA(Fused Multiply-Add)라는 괴물 연산기로 진화하며 신경망 연산의 최전선에서 활약하고 있다. 3-주소 명령어는 가장 논리적이고 수학적인 기계어의 완성형이다.

📢 섹션 요약 비유: 3-주소 명령어의 승리는 '대형 마트'의 승리와 같습니다. 골목 슈퍼(1, 2-주소)는 가깝고 공간은 적게 차지하지만 물건을 살 때마다 이거 치우고 저거 치우는(MOV 복사) 번거로움이 있습니다. 반면 대형 마트(3-주소)는 땅(명령어 길이)을 많이 차지하더라도, 진열대(주소 3개)가 완벽하게 나뉘어 있어 카트를 끌고 한 번에 원하는 걸 다 담아오는 압도적인 효율성을 보여줍니다.

📌 관련 개념 맵 (Knowledge Graph)

개념 명칭	관계 및 시너지 설명
RISC (Reduced Instruction Set Computer)	3-주소 명령어의 요람. 복잡함을 버리고 단순하고 명시적인 3-주소 고정 길이를 택한 아키텍처 철학.
Non-Destructive (비파괴적 연산)	3-주소의 가장 위대한 특성. 입력 데이터(Src)와 출력 데이터(Dest) 공간을 분리하여 원본을 완벽히 보호한다.
GPR (General Purpose Register)	3-주소가 뛰어노는 운동장. 범용 레지스터가 32개쯤 넉넉히 있어야 3개의 주소를 마음껏 쓸 수 있다.
Instruction Scheduling (스케줄링)	컴파일러가 3-주소 명령어들의 순서를 이리저리 바꿔 파이프라인의 빈 공간을 빈틈없이 채워 넣는 마법.
Code Bloat (코드 비대화)	3-주소 명령어의 치명적 약점. 주소를 3개나 쓰느라 명령어 하나가 4바이트로 뚱뚱해져 캐시 메모리를 빨리 소진한다.

👶 어린이를 위한 3줄 비유 설명

3-주소 명령어는 요리사에게 **"밀가루(A)랑 계란(B)을 섞어서, 오븐용 새 그릇(C)에 담아라!"**라고 완벽하게 지시하는 방법이에요.
예전(2-주소)에는 밀가루 포대(A) 안에 바로 계란을 섞어서 포대를 버려야 했는데, 이제는 원래 재료를 안 망치고 새 그릇을 쓰니까 너무 깔끔하죠.
명령어가 쪼금 길어지긴 했지만, 컴퓨터가 헷갈리지 않고 여러 가지 요리를 동시에(병렬 처리) 아주 빠르게 할 수 있는 최고의 비결이랍니다!