피처 스토어 & MLOps 고도화

별점: ★★★★★ | ★136회 연계


답안.

Ⅰ. 개요

정의: ML 모델에 사용되는 피처(특성)를 저장·관리· Training-Serving Skew: 오프라인 스토어: Parquet, S3 (학습용 배치)

Ⅱ. 핵심 구성요소

정의: ML 모델에 사용되는 피처(특성)를 저장·관리·
     재사용하는 중앙 저장소

[문제 해결]
Training-Serving Skew:
  학습: 과거 데이터로 피처 계산
  서빙: 실시간 피처 계산
  → 로직 차이로 성능 저하

피처 중복:
  각 팀이 같은 피처를 다르게 계산

[피처 스토어 구성]
오프라인 스토어: Parquet, S3 (학습용 배치)
온라인 스토어: Redis, DynamoDB (추론용 실시간)
피처 레지스트리: 메타데이터, 버전, 소유자

[도구]
Feast (오픈소스), Tecton, Hopsworks
AWS SageMaker Feature Store
Databricks Feature Store
[드리프트 유형]
데이터 드리프트 (Data Drift):
  입력 데이터 분포 변화
  예) 코로나 → 사용자 행동 패턴 급변

개념 드리프트 (Concept Drift):


해당 키워드의 기술적 구성요소와 동작 원리를 서술한다.

### Ⅲ. 특징 및 비교

핵심 기술의 장단점과 유사 기술과의 차이를 분석한다.

### Ⅳ. 적용 사례

실무 환경에서의 적용 사례와 기대효과를 제시한다.

### Ⅴ. 전망

최신 기술 동향과 향후 발전 방향을 서술한다.