Brain
Science
root
/
학습 노트
/
Study Note
/
16: 빅데이터 (Big Data)
/
2. 하둡 에코시스템 및 HDFS
2. 하둡 에코시스템 및 HDFS
01. 아파치 하둡 (Apache Hadoop) - 분산 스토리지 및 처리
2026-03-04
02. HDFS (Hadoop Distributed File System) - 하둡 분산 파일 시스템
2026-03-04
03. 네임노드 (NameNode) - 메타데이터 관리와 고가용성
2026-03-04
04. Apache ZooKeeper - 분산 코디네이션의 간호사
2026-04-05
05. Apache Oozie와 Airflow - 워크플로우 오케스트레이션의 진화
2026-04-05
06. Apache Tez
07. 데이터노드 (DataNode) - HDFS 분산 저장의 워커 노드 및 블록 관리
2026-03-04
08. 랙 인지 (Rack Awareness) - 물리적 장애 격리를 위한 데이터 복제 전략
2026-03-04
09. 맵리듀스 (MapReduce) - 대규모 데이터 병렬 처리를 위한 분산 프로그래밍 모델
2026-03-04
Map 함수: MapReduce 분산 처리의 시작
2026-03-04
Reduce 함수: 분산 데이터의 최종 집계 및 요약
2026-03-04
셔플 및 정렬 (Shuffle & Sort): 분산 컴퓨팅의 네트워크 병목
2026-03-04
YARN: 하둡의 클러스터 자원 관리 및 통합 스케줄링 계층
2026-03-04
Apache Hive: 하둡 기반의 SQL 온 하둡(SQL-on-Hadoop) 데이터 웨어하우스
2026-03-04
Apache HBase: 하둡 기반의 고성능 분산 NoSQL 데이터베이스
2026-03-04
16. 아파치 피그 (Apache Pig) - 하둡 데이터 흐름 스크립팅
2026-03-04
17. 아파치 스쿱 (Apache Sqoop) - RDBMS ↔ 하둡 데이터 전송
2026-03-04
18. 아파치 플룸 (Apache Flume) - 대규모 로그 수집 및 전송
2026-03-04
아파치 암바리 (Apache Ambari)
2026-03-04
Cloudera CDP (Cloudera Data Platform)
2026-03-04
HDFS Small File Problem (HDFS 작은 파일 문제)
2026-03-04
아파치 스톰 (Apache Storm) 및 실시간 분산 처리
2024-03-24
23. 추천 시스템 (Recommendation System) — 협업 필터링 vs 콘텐츠 기반
2026-04-02
24. 예측 분석 (Predictive Analytics) — 과거 기반 미래 확률 예지
2026-04-02
25. 처방적 분석 (Prescriptive Analytics) — 의사결정 최적화 및 자동화
2026-04-02
데이터 직렬화 (Serialization): Avro, Protobuf, Thrift
2024-03-24
Hadoop 보안: Kerberos, Ranger, Atlas
2024-03-24