Brain
Science
root
/
학습 노트
/
Study Note
/
16: 빅데이터 (Big Data)
/
3. 아파치 스파크 (Apache Spark) 및 인메모리 연산
3. 아파치 스파크 (Apache Spark) 및 인메모리 연산
01. Apache Spark — 인메모리 분산 처리 엔진 (Unified Analytics Engine)
2026-04-05
02. RDD (Resilient Distributed Dataset) — 불변 분산 데이터셋
2026-04-05
03. 지연 평가 (Lazy Evaluation) — 연산 최적화 전략
2026-04-05
04. Spark SQL & DataFrame — 정형 데이터 처리 및 최적화
2026-04-14
Catalyst Optimizer
2024-03-23
Tungsten Engine
2024-03-23
적응형 쿼리 실행 (Adaptive Query Execution, AQE)
2024-03-23
Spark Streaming (DStream) 아키텍처
2024-03-24
스파크 구조적 스트리밍 (Spark Structured Streaming)
2026-04-05
스파크 엠엘립 (Spark MLlib) - 분산 머신러닝 라이브러리
2026-04-05
스파크 그래프엑스 (Spark GraphX) - 분산 그래프 분석
2026-04-05
스파크 배포 모드 (Spark Deployment Modes)
2024-03-23
스파크 런타임 아키텍처 (Executor / Driver / Cluster Manager)
2024-03-23
Spark Shuffle 최적화 (Shuffle Optimization)
2026-03-04
Spark 데이터 직렬화 (Data Serialization)
2026-03-04
Spark Broadcast Join
2026-03-04