핵심 인사이트 (3줄 요약)
- 평소 CPU는 DVFS를 통해 똑똑하게 전압과 클럭을 오르내리지만, 쿨러(Fan)가 갑자기 물리적으로 박살 나서 온도가 **$100^\circ C$ (TjMax)**에 도달하면 이 우아한 제어는 소용이 없어진다.
- 이때 칩이 파괴되는 것을 막기 위해 CPU 내장 하드웨어가 개입하여, 강제로 전압과 클럭을 최소한의 생존 수준(예: 800MHz)으로 곤두박질치게 만드는 것이 **치명적 다운클럭킹 (Thermal Throttling / Safe Mode)**이다.
- 이 상태에 빠지면 마우스 커서조차 1초에 한 번씩 뚝뚝 끊기며 서버가 사실상 마비되지만, 칩셋이 녹아 메인보드까지 불타는 수백만 원의 물리적 손실은 막을 수 있다.
Ⅰ. 온도의 폭주 (Thermal Runaway)
현대 CPU는 1제곱센티미터($cm^2$) 당 내뿜는 열이 다리미 열선보다 훨씬 높습니다. 만약 CPU 위에 붙어있는 수랭 쿨러 펌프가 퍽 하고 고장 났다고 합시다.
- 열이 빠져나갈 곳이 없어 CPU 코어 온도가 1초 만에 70도 $\rightarrow$ 90도 $\rightarrow$ 100도로 치솟습니다.
- 온도가 오르면 트랜지스터 절연막에서 전자가 마구 새어나갑니다(누설 전류 폭발).
- 새어나간 전류가 또 열을 만듭니다. 온도가 110도, 120도를 뚫고 올라갑니다.
이 끔찍한 연쇄 반응을 **열 폭주(Thermal Runaway)**라고 하며, 130도를 넘어가면 실리콘이 쩍 갈라지거나 납땜이 녹아 칩이 물리적으로 영구 파괴됩니다.
📢 섹션 요약 비유: 원자력 발전소의 냉각수 파이프가 터진 상황입니다. 열이 열을 낳아 노심융용(Meltdown)이 일어나기 직전의 끔찍한 비상사태입니다.
Ⅱ. 최후의 생존술: 하드웨어 강제 다운클럭킹
100도(TjMax)를 찍는 순간, OS(윈도우)가 뭐라 하든 상관없이 CPU 하드웨어 센서가 생존 본능을 발동합니다.
- PROCHOT# 신호 발송: 칩 내부의 온도 센서가 메인보드에 "나 지금 죽을 거 같아!"라는 물리적 전기 신호(PROCHOT# 핀)를 쏩니다.
- Duty Cycle 강제 조절 (Clock Modulation): 클럭 속도(주파수)를 낮추는 걸 넘어서, 아예 클럭 신호 자체를 토막 냅니다. 예를 들어 8번의 틱톡(클럭) 중에서 4번은 강제로 전기를 안 줘서 트랜지스터를 재워버립니다(50% Modulation).
- 바닥으로 쳐박힌 성능 (안전 모드): 5GHz로 돌던 최신 CPU가 순식간에 800MHz 펜티엄급 성능으로 곤두박질칩니다.
온도와 성능의 변화 (ASCII)
온도 ($^\circ C$)
110 │ (Thermtrip: 전원 강제 차단, 셧다운!)
100 │ 🔥 ◀ (TjMax 도달: PROCHOT# 핀 활성화 $\rightarrow$ 다운클럭킹 발동)
90 │ ↗ │ (마우스 커서도 버벅거림)
80 │ ↗ │
70 │ ───● │ (정상 작동)
────┼─────────────┴───────────────────────▶ 시간
정상 쿨러 고장
📢 섹션 요약 비유: 마라톤 선수가 뛰다가 심박수가 200을 넘어 쓰러지기 일보 직전입니다. 뇌(하드웨어)가 다리 근육으로 가는 신경(클럭)을 강제로 끊어버려서, 선수의 의지(OS)와 상관없이 그 자리에 주저앉아 헐떡이게(다운클럭) 만들어 목숨을 구합니다.
Ⅲ. THERMTRIP# (최종 셧다운)
만약 800MHz로 성능을 깎았는데도, 쿨러가 아예 떨어져 나가서 온도가 110도를 넘으면 어떻게 될까요? 이때는 다운클럭킹도 소용없습니다. CPU는 최후의 수단으로 **THERMTRIP# (Thermal Trip)**이라는 핀에 전기를 흘립니다.
이 신호가 메인보드 칩셋에 닿는 즉시, 컴퓨터의 전원 코드(파워서플라이)가 0.001초 만에 강제로 팍! 꺼집니다. 아무런 에러 메시지도, 블루스크린도 없이 컴퓨터 전원이 갑자기 뚝 끊겼다면, 당신의 CPU가 불타기 0.1초 전에 스스로 자결하여 메인보드라도 살려낸 거룩한 희생(THERMTRIP)입니다.