시계열 DB 보간 (Interpolation) 쿼리 기능

핵심 인사이트 (3줄 요약)

  1. 본질: 보간 (Interpolation)은 IoT 센서 결함이나 네트워크 지연으로 인해 시계열 데이터 파이프라인에 누락 구간(Missing Data, 결측치)이 발생했을 때, 주변의 정상 데이터를 기반으로 수학적 추론을 거쳐 비어 있는 시점의 값을 가상으로 메워주는 시계열 데이터베이스 (TSDB) 특화 연산 기능이다.
  2. 가치: 일반 RDBMS에서는 결측치가 NULL로 처리되어 다운샘플링 연산(AVG, SUM) 시 집계 에러를 유발하거나 대시보드 차트의 선이 끊어지는 시각적 단절을 초래하지만, 보간 쿼리를 내장한 TSDB를 사용하면 애플리케이션 코드 수정 없이 완벽하게 연속적인 (Continuous) 데이터 스트림을 실시간으로 확보할 수 있다.
  3. 융합: 보간 기능은 데이터를 듬성듬성 묶어버리는 다운샘플링(Downsampling)과 반대로, 불규칙한 타임스탬프를 고정된 주기(예: 1분 단위)의 정렬된 격자로 맞추는 정규화 (Alignment) 파이프라인의 핵심 전처리 단계로, 후행하는 머신러닝 이상 탐지(Anomaly Detection) 모델의 입력 데이터 무결성을 보장한다.

Ⅰ. 개요 및 필요성 (Context & Necessity)

  • 개념: 시계열 보간 (Time-series Interpolation)은 이산적으로 측정된 데이터 포인트들 사이에 알려지지 않은 구간의 값을 앞뒤 데이터 패턴(직선, 계단식, 곡선 등)을 활용해 수학적으로 근사치(Approximation)를 계산하여 채워 넣는 쿼리 레벨의 함수 기능이다.

  • 필요성: 스마트 팩토리의 온도 센서가 1초에 한 번씩 서버로 데이터를 보낸다고 가정하자. 완벽한 네트워크 환경이라면 1분에 정확히 60개의 데이터 포인트가 DB에 적재되어야 한다. 그러나 현실의 물리적 환경에서는 센서 배터리 방전, 일시적 와이파이 단절, 수집 서버의 가비지 컬렉션(GC) 일시 정지 등으로 인해 데이터 누락이 필연적으로 발생한다. 이 불완전한 상태에서 "최근 1시간의 1분 단위 평균 온도를 구하라"는 집계 쿼리를 날리면, 데이터가 누락된 분(Minute) 구간은 결과가 아예 반환되지 않거나 NULL을 뱉게 된다. 애플리케이션 프론트엔드에서는 이를 처리하지 못해 에러 창을 띄우거나 차트 중간이 이 빠진 것처럼 그려지며, 인공지능 예측 모델은 이 NULL 값 때문에 학습 파이프라인이 붕괴한다. 따라서 비어 있는 점들을 매끄럽게 연결해 주는 보조 장치가 반드시 필요하다.

  • 등장 배경 및 기술적 해결: 과거에는 이러한 결측치를 보정하기 위해 백엔드 개발자나 데이터 엔지니어가 Python (Pandas) 코드로 데이터를 퍼올린 뒤, 배열을 순회하며 빈 공간을 계산해 채우는 무거운 전처리 스크립트를 작성해야 했다. 그러나 InfluxDB, Prometheus, TimescaleDB 같은 시계열 전문 데이터베이스(TSDB)가 부상하면서, 데이터가 영속(Persist) 계층에서 읽혀 나오는 SELECT 쿼리 실행 시점에 엔진 내부에서 실시간으로 보간을 수행하여 완벽한 데이터셋으로 조립해 반환하는 쿼리 문법(interpolate(), LOCF 등)이 표준 기능으로 자리 잡았다.

이 다이어그램은 센서 수집 중 발생한 데이터 누락이 다운스트림 집계 쿼리에 미치는 파괴적인 영향과, 이를 극복하는 보간의 역할을 대비해 보여준다.

  ┌───────────────────────────────────────────────────────────────┐
  │         결측치(Missing Data) 문제와 보간(Interpolation)의 역할      │
  ├───────────────────────────────────────────────────────────────┤
  │                                                               │
  │  [A. 현실의 센서 데이터 수집 상태 (네트워크 단절 발생)]             │
  │     10:00 (20도) ──▶ 10:01 (22도) ──▶ 10:02 (네트워크 오류! 💥)     │
  │     ──▶ 10:03 (오류! 💥) ──▶ 10:04 (28도)                       │
  │                                                               │
  │  [B. 일반 RDBMS 쿼리 결과 (보간 없음)]                           │
  │   - 차트 렌더링 :  20 --- 22      (단절)      28                │
  │   - 통계 연산 : SUM(temp) 에러 또는 NULL 파편화 발생               │
  │   - 결과: BI 대시보드 붕괴, AI 모델 입력 에러                      │
  │                                                               │
  │  [C. 시계열 DB 보간 쿼리 적용 결과 (선형 보간 예시)]                 │
  │   - 10:01(22도)와 10:04(28도)를 이어서 가상의 직선을 생성.         │
  │     시간당 2도씩 올랐으리라 수학적으로 합리적인 추론 발동.             │
  │                                                               │
  │   - DB 반환 결과:                                              │
  │     10:00 (20)                                                │
  │     10:01 (22)                                                │
  │     10:02 (24) ◀ DB가 실시간으로 가상 계산하여 반환! 🟢              │
  │     10:03 (26) ◀ DB가 실시간으로 가상 계산하여 반환! 🟢              │
  │     10:04 (28)                                                │
  │                                                               │
  │  ★ 핵심: 애플리케이션 로직 수정 없이, 쿼리문 하나로 결함 데이터를 치료함.  │
  └───────────────────────────────────────────────────────────────┘

[다이어그램 해설] 이 구조는 TSDB의 가장 강력한 강점 중 하나인 동적 시계열 정렬(Time-series Alignment) 메커니즘을 시각화한다. 타임스탬프가 불규칙하게 흩어져 있고 일부가 유실된 A 상태의 로우(Raw) 데이터를 RDBMS에서 있는 그대로 읽어 들이면(B 상태), 애플리케이션은 시간 간격(Interval)이 일정하지 않은 이산 배열을 처리하기 위해 엄청난 예외 처리 코드를 작성해야 한다. 그러나 TSDB의 보간 쿼리를 태우면(C 상태), DB 엔진 메모리 내에서 앞(22도)과 뒤(28도)의 기준점을 잡고 기울기(Gradient)를 계산하여 누락된 10:02와 10:03의 1분 단위 타임스탬프(Bucket)를 강제로 생성하고 그곳에 적합한 가상의 숫자(24, 26)를 채워버린다. 데이터 소비자 입장에서는 애초에 센서 장애가 일어난 적이 없는 것처럼 1분 단위의 완벽하게 꽉 찬(Dense) 시계열 배열을 받게 되는 것이다.

  • 📢 섹션 요약 비유: 낡은 필름 영화를 볼 때 중간에 필름 프레임 2~3장이 찢겨 나가 화면이 검게 깜빡이는 것을 막기 위해, 컴퓨터가 앞장면과 뒷장면을 보고 중간에 어떤 동작이 있었을지 상상해서 그림을 그려 넣어 매끄러운 영상을 재생해 주는 AI 복원 기술과 같습니다.

Ⅱ. 아키텍처 및 핵심 원리 (Deep Dive)

3대 보간 알고리즘 메커니즘 분석

결측치를 어떤 형태의 상상력으로 채울 것인가는 데이터의 비즈니스 도메인(성질)에 따라 결정해야 한다. 잘못된 알고리즘을 선택하면 멀쩡한 통계를 완전히 망가뜨린다.

알고리즘동작 메커니즘적용 대상 데이터 성질 (도메인)특징 및 주의점
선형 보간 (Linear)누락 구간의 이전 값과 이후 값을 잇는 일차 함수(직선)의 중간값을 계산연속적 (Continuous) 변량
(온도, 습도, 주식 가격 곡선, 연료량)
서서히 증감하는 자연계 데이터에 적합. 직관적이고 연산 비용이 낮다.
LOCF / 이전 값 유지누락 시점이 발견되면, 가장 최근에 측정된 과거의 마지막 정상 값을 그대로 복사해서 현재 빈칸에 덮어씀이산적 (Discrete) 변량, 상태값
(서버 ON/OFF, 문 열림 상태, 잔액)
상태가 변하기 전까지는 이전 상태를 유지한다는 논리. 계단 모양 차트 형성. (NOCB 등 반대 개념도 존재)
스플라인 (Spline)여러 과거/미래 점들의 추세를 다항식 곡선 함수로 연결하여 부드러운 궤적을 예측물리적 궤도, 비행체 경로, 고도화된 스무딩(Smoothing) 차트매우 자연스러운 선을 만들지만 연산 비용(CPU)이 비싸고 극단적인 스파이크 시 과적합 오차가 발생할 수 있음

보간과 다운샘플링 융합 파이프라인 (Flux Query 구조)

InfluxDB의 데이터 스크립트 언어인 Flux를 통해 실제 보간 엔진이 어떻게 작동하는지 파이프라인 구조로 해부해 본다.

  ┌──────────────────────────────────────────────────────────────────┐
  │        시계열 데이터 정규화(Alignment) 및 보간 파이프라인 엔진        │
  ├──────────────────────────────────────────────────────────────────┤
  │                                                                  │
  │  [ 쿼리 파이프라인의 3단계 실행 과정 (InfluxDB Flux 예시) ]         │
  │                                                                  │
  │  1단계: 데이터 필터링 및 로드 (Extract)                             │
  │    |> from(bucket: "factory_data")                               │
  │    |> filter(fn: (r) => r._field == "temperature")               │
  │        => (결과: 타임스탬프가 삐뚤빼뚤하고 이 빠진 원시 레코드 집합)        │
  │                                                                  │
  │  2단계: 타임 버킷(Bucket) 윈도우 할당 및 다운샘플링 (Aggregate)       │
  │    |> aggregateWindow(every: 1m, fn: mean)                       │
  │        => (결과: 1분 단위의 고정된 시간 격자 생성.                   │
  │            데이터가 여러 개면 평균(mean) 내서 하나로 압축.          │
  │            데이터가 아예 없는 분(Minute) 격자는 값에 'NULL' 할당)    │
  │                                                                  │
  │  3단계: 보간 (Interpolation) 적용 (Fill)                           │
  │    |> interpolate.linear(every: 1m)                              │
  │        => (결과: 2단계에서 생성된 'NULL' 버킷을 찾아내어,            │
  │            앞뒤 버킷의 정상 값을 참조해 선형 방정식으로 가상 값 주입!)  │
  │                                                                  │
  │  ★ DB 엔진 내부에서 "수집 → 규격화(버킷링) → 빈칸 수학적 채움"의       │
  │     전처리 파이프라인이 하나의 트랜잭션 흐름으로 매끄럽게 처리됨.          │
  └──────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 이 파이프라인 구조는 보간이 결코 단독으로 쓰이지 않는다는 기술사적 핵심을 짚어준다. 보간을 하려면 "어떤 시간 간격으로 빈칸을 찾을 것인가" 하는 기준선이 먼저 필요하다. 이것이 바로 타임 버킷(Time Bucket) 윈도우다. 2단계의 aggregateWindow 연산은 불규칙한 센서 기록 시간들을 정교한 '1분짜리 모눈종이 격자'에 강제로 끼워 맞춘다. 격자 칸에 점이 여러 개 뭉쳐있으면 평균(mean)을 내서 대푯값을 만들고(다운샘플링), 격자 칸이 텅 비어 있으면 임시로 NULL 팻말을 꽂아둔다. 이어지는 3단계의 interpolate 함수는 오직 이 NULL 팻말이 꽂힌 빈 격자만을 찾아다니며, 양옆에 있는 정상 격자들의 값을 참조해 지정된 알고리즘(Linear 등)으로 빈칸을 감쪽같이 칠해버린다. 이 흐름을 이해하면, 다운샘플링과 보간은 동전의 양면처럼 함께 움직여 불규칙한 시계열을 AI가 소비하기 좋은 정규화(Normalized) 텐서(Tensor)로 변환해 주는 완벽한 파트너임을 알 수 있다.

  • 📢 섹션 요약 비유: 이 빠진 톱니바퀴로는 기계를 돌릴 수 없듯이, 데이터 엔진은 고장 난 톱니 자리에 주변 톱니의 모양(곡선 추세)과 정확히 똑같이 쇳물을 부어 새 톱니(보간 데이터)를 실시간으로 주조해 냄으로써 전체 기계(대시보드, AI)가 멈추지 않게 합니다.

Ⅲ. 융합 비교 및 다각도 분석 (Comparison & Synergy)

보간(Interpolation) vs 외삽(Extrapolation) 매트릭스

결측치 처리에서 보간과 헷갈리기 쉬운 개념이 외삽이다. 두 기법의 본질과 위험성을 비교한다.

비교 항목보간 (Interpolation / 메우기)외삽 (Extrapolation / 예측하기)
행위의 방향과거의 두 알려진 점(A와 B) 사이의 틈을 추론과거의 기록 추세를 바탕으로 아직 오지 않은 미래(C)를 추론
안전성 (신뢰도)앞뒤 닫힌 구간 안에서의 유추이므로 상대적으로 안전함 (오차 범위 제한)미래의 돌발 변수를 모르므로 궤적이 멀어질수록 치명적 오차 (발산) 발생 위험 큼
TSDB 지원 여부쿼리 함수로 거의 모든 시계열 DB가 기본 내장 제공 (LOCF, linear)DB 쿼리만으로는 한계가 있어 외부 ARIMA, 머신러닝 예측 모델 연동이 필요
실무 활용 시나리오끊어진 센서 모니터링 차트의 선분 부드럽게 잇기내일 서버 디스크 용량 가득 찰 시간 예측(Forecast) 아웃라이어 알림

보간(Interpolation)은 두 벽면 사이를 잇는 안전한 다리를 놓는 작업이라면, 외삽(Extrapolation)은 허공을 향해 다리를 길게 뻗어나가는 위태로운 작업이다. 따라서 모니터링 시각화에서는 보간을 적극 사용하되, 단순 선형 함수 기반의 외삽 결과를 비즈니스 예측에 직접 사용하는 것은 극도로 경계해야 하는 안티패턴이다.

데이터 파이프라인(DataOps) 측면의 시너지

머신러닝 옵스(MLOps) 파이프라인에서 딥러닝(RNN, LSTM) 모델은 고정된 간격(Timestep)의 텐서 데이터 입력을 강제한다. 만약 데이터셋 중간에 NaN이 섞여 들어가면 행렬곱 연산 결과가 연쇄적으로 NaN이 되어 모델 가중치가 파괴된다. TSDB 단에서 쿼리 시점에 강력한 보간을 통해 결측치를 1차 방어해 주면, DataOps의 파이프라인 전처리 레이어가 비약적으로 단순화되고 전체 아키텍처의 민첩성이 상승하는 시너지가 폭발한다.

  • 📢 섹션 요약 비유: 보간이 '다리 양쪽 끝이 있을 때 가운데 무너진 상판을 복구하는 안전한 보수 공사'라면, 외삽은 '허공에 대고 미래 방향으로 절벽 다리를 이어붙이는 아슬아슬한 모험'입니다.

Ⅳ. 실무 적용 및 기술사적 판단 (Strategy & Decision)

실무 시나리오 및 의사결정

  1. 시나리오 — 클라우드 이관 작업 중 서버 장애 알림 오작동: 온프레미스 장비를 클라우드로 옮기는 15분 동안 서버 상태를 체크하는 핑(Ping) 데이터가 수집되지 않았다. 15분 뒤 모니터링 대시보드에는 서버가 'DOWN'된 것으로 오해석하여 비상 알림이 수십 개 발송되었다. 빈칸을 숫자 0(Down)으로 무식하게 처리했기 때문이다.

    • 의사결정: 서버의 활성(UP)/비활성(DOWN) 여부는 선형 보간(중간값 0.5)을 쓰면 의미가 없는 이산 데이터(Discrete State)다. 쿼리 파이프라인에 LOCF (Last Observation Carried Forward) 보간 함수를 적용한다. 이관 직전 마지막 수집 값이 'UP(1)'이었다면, 수집이 끊긴 15분 동안의 빈 버킷도 모두 'UP(1)' 상태로 복사하여 유지시킴으로써 불필요한 장애 알림(False Alarm)을 억제하고 모니터링 노이즈를 제거한다.
  2. 시나리오 — 장기 네트워크 단절 시 선형 보간의 과도한 상상력: 산악 지대에 설치된 강우량 센서가 태풍으로 통신이 두절되어 3일간 데이터가 오지 않다가 복구되었다. 단절 전 누적 강우량이 100mm, 3일 뒤 복구 시점이 400mm였다. DB에 1시간 단위 선형 보간(interpolate.linear(1h))을 걸어두었더니, 3일 내내 비가 똑같은 속도로 찔끔찔끔 일정하게 온 것으로 왜곡된 그래프가 그려졌다. (실제로는 마지막 날 폭우가 쏟아졌음).

    • 의사결정: 두 기준점 사이의 시간 간격이 너무 멀면, 보간 알고리즘이 현실 세계의 비선형적 돌발 변수를 모두 뭉개버리고 거짓 왜곡(Distortion)을 만든다. 기술사적 설계에서는 반드시 보간의 최대 한계 시간(Maximum Gap Limit) 파라미터를 설정해야 한다. "빈칸이 1시간 이내일 때만 보간하고, 1시간을 넘어가는 장기 결측 구간은 보간을 포기하고 명시적으로 끊어진 붉은색 점선(NULL 상태 보존)으로 렌더링하라"는 예외 정책을 아키텍처에 반영하여 통계 조작의 위험을 회피한다.

보간(Interpolation) 알고리즘 선택 의사결정 트리

데이터 성격에 맞지 않는 보간은 데이터 조작이나 다름없다. 올바른 전략 수립이 필수다.

  ┌───────────────────────────────────────────────────────────────────┐
  │           시나리오별 최적 보간(Interpolation) 전략 결정 트리           │
  ├───────────────────────────────────────────────────────────────────┤
  │                                                                   │
  │   [누락 구간(Missing Data)이 발견됨]                                  │
  │                │                                                  │
  │                ▼                                                  │
  │      결측 발생 시간이 시스템이 정한 허용 임계치(Max Gap)를 초과했는가?    │
  │          ├─ 예 (너무 긴 공백) ──▶ [보간 금지 (차트 단절 명시적 표현)]     │
  │          │                                                        │
  │          └─ 아니오 (짧은 누락)                                      │
  │                │                                                  │
  │                ▼                                                  │
  │      데이터가 서버 ON/OFF, 에러 코드 등 불연속적 상태(State) 값인가?      │
  │          ├─ 예 ─────▶ [LOCF (Last Observation Carried Forward) 적용] │
  │          │             (이전 상태가 변동 없이 유지됐다고 간주)         │
  │          │                                                        │
  │          └─ 아니오 (온도, 압력 등 연속적인 수치 데이터)                 │
  │                │                                                  │
  │                ▼                                                  │
  │      정밀한 곡선 추적이 필요한가, 빠른 연산(성능)이 우선인가?             │
  │          ├─ 빠른 성능 우선 ──▶ [Linear Interpolation (선형/직선 보간)]  │
  │          └─ 부드러운 곡선 ──▶ [Spline Interpolation (다항식 곡선 보간)]  │
  │                                                                   │
  │   판단 포인트: "성질에 맞지 않는 보간은 데이터를 부드럽게 망치는 지름길" │
  └───────────────────────────────────────────────────────────────────┘

[다이어그램 해설] 이 의사결정 트리는 현장 데이터 엔지니어가 겪는 전형적인 실패 모드를 방어한다. 아무리 좋은 기능도 오용하면 독이 된다. 서버 다운 여부 값(0 또는 1)에 선형 보간을 걸면 서버가 '0.5'만큼 다운되었다는 괴상한 수치가 DB에서 튀어나와 시스템 로직에 예외(Exception)를 터트린다. 또한, 1년 치 과거 데이터를 조회하는 무거운 배치 배치 쿼리에 스플라인(Spline)처럼 복잡한 다항식 기반 보간을 거는 순간 쿼리 엔진의 CPU가 폭발하며 DB 클러스터가 마비될 수 있다. 따라서 쿼리 시점의 오버헤드와 도메인 정합성을 저울질하여 가장 단순하고 논리적인 LOCF나 Linear 방식을 기본(Default)으로 채택하는 보수적 접근이 권장된다.

  • 📢 섹션 요약 비유: 물감이 번진 그림을 복원할 때, 하늘의 번진 부분은 부드러운 파란색 그라데이션(선형 보간)으로 채우면 되지만, 사람 얼굴 눈코입이 날아간 곳에 살구색만 덩그러니 칠해버리면(과도한 보간) 눈먼 괴물이 되는 것처럼 한계와 특징을 명확히 알아야 합니다.

Ⅴ. 기대효과 및 결론

정량/정성 기대효과

구분일반 RDBMS 쿼리 (보간 없음)TSDB 내장 보간 쿼리 적용개선 효과
정량결측치 포함 시 다운샘플링 집계 오차 증가앞뒤 패턴 반영 추정값으로 수학적 보정평균/누적 통계치 왜곡 90% 이상 억제
정성앱단에서 결측 보완 스크립트 작성 필수DB 엔진 차원의 함수(interpolate) 1줄 호출애플리케이션 프론트/백엔드 로직 복잡도 제거
정성머신러닝 학습 모델 입력 시 차원 붕괴 발생완벽하게 정렬된 연속적 텐서 어레이 공급AI 파이프라인의 단절 없는 안정적 운영 확보

미래 전망

  • AI 기반 지능형 갭 필링 (AI-based Imputation): 단순한 직선이나 과거 값 복사를 넘어서, TSDB 내부에 경량화된 머신러닝 모델(Lightweight LSTM 등)이 내장되어 수년간 누적된 해당 센서의 계절성(Seasonality)과 주기성 주파수를 스스로 분석해, 비어있는 구간에 가장 현실 세계와 가까운 정밀한 패턴(Pattern)을 그려 넣는 AI 기반 딥러닝 보간 쿼리가 등장하고 있다.
  • 스트리밍 윈도우 보간: 과거 배치성 쿼리뿐 아니라 Apache Flink, Kafka Streams 등과 결합해 실시간으로 유입되는 이벤트 스트림 윈도우 내에서 마이크로초(us) 단위의 데이터 딜레이가 발생할 때, 실시간 메모리 내에서 틈새를 메워 다운스트림 시스템으로 밀어주는 스트리밍 보간 기술이 고도화되고 있다.

참고 표준

  • SQL:2016 표준 확장안 (Part 15: MDA - Multi-Dimensional Arrays): 고정 격자 데이터 분석을 위한 시계열 배열 함수 문법 표준화 움직임
  • 산업용 IoT 국제 표준 (IIoT Architecture): 신뢰성 있는 장비 데이터 수집 파이프라인 무결성을 위한 결측치 보정 가이드라인

결론적으로, 현실 세계의 물리적 정보(IoT, 메트릭, 로그)를 기록하는 시스템에서 데이터 손실은 피할 수 없는 물리 법칙과 같다. 시계열 DB의 보간(Interpolation) 기능은 이 피할 수 없는 '빈 공간(Void)'을 시스템 장애로 받아들이지 않고, 수학적 유연성을 통해 데이터의 연속성을 이어주는 가장 우아한 소프트웨어적 해결책이다. 훌륭한 데이터 파이프라인 설계는 데이터가 완벽하게 수집될 것을 가정하는 것이 아니라, 수집망이 뚫렸을 때 데이터베이스 엔진이 얼마나 스마트하게 그 틈을 메우고 전체 시스템의 붕괴를 막아내는가에 달려 있다.

  • 📢 섹션 요약 비유: 울퉁불퉁한 자갈길(결측치 데이터) 위에 아스팔트 포장재(보간 기술)를 부어 매끄러운 고속도로를 만들어 놓으면, 그 위를 달리는 자동차(AI 분석 모델)가 덜컹거림 없이 최고 속도로 달릴 수 있는 튼튼한 인프라가 완성됩니다.

📌 관련 개념 맵 (Knowledge Graph)

개념 명칭관계 및 시너지 설명
시계열 데이터베이스 (TSDB)보간 함수(LOCF, Linear)와 다운샘플링 윈도우 함수를 기본 쿼리 문법으로 내장하여 강력한 시너지를 내는 최적의 저장 엔진이다.
다운샘플링 (Downsampling)데이터가 없는 곳에 보간을 하기 전, 불규칙한 타임스탬프를 고정된 단위(예: 1분)의 격자 구조로 압축 정렬해 주는 선행 필수 작업이다.
이상 탐지 (Anomaly Detection)비정상적인 스파이크를 찾는 모델로, 결측치를 0으로 두면 이상치로 오해하므로 사전에 보간 처리를 통해 노이즈를 제거해야 준다.
외삽 (Extrapolation)보간이 닫힌 구간의 안쪽을 메우는 것이라면, 외삽은 현재 추세를 연장해 미래의 데이터 값을 예측하는 위험하고 결이 다른 기법이다.
그라파나 (Grafana)보간된 시계열 데이터를 시각화하는 데 특화된 대시보드 툴로, 쿼리에 보간 함수가 없더라도 프론트엔드 단에서 시각적 선 잇기(Connect nulls) 기능을 제공한다.

👶 어린이를 위한 3줄 비유 설명

  1. 내가 일주일 동안 매일 키를 쟀는데, 깜빡하고 수요일에는 키를 안 쟀어요. 그래프를 그리면 수요일 칸이 텅 비어있겠죠?
  2. 선형 보간은 "화요일에 130cm였고 목요일에 132cm였으니까, 중간인 수요일은 131cm였을 거야!"라고 똑똑하게 상상해서 빈칸을 채워주는 거예요.
  3. 이렇게 데이터베이스가 빈칸을 진짜 같은 가짜 점으로 예쁘게 채워주면, 컴퓨터는 에러를 내지 않고 7일 내내 쭉 이어진 멋진 키 성장 그래프를 화면에 보여줄 수 있답니다!