Brain
Science
root
/
학습 노트
/
Study Note
/
5: 데이터베이스 (Database)
/
6. 데이터 웨어하우스, OLAP 및 최신 트렌드
6. 데이터 웨어하우스, OLAP 및 최신 트렌드
321. 데이터 웨어하우스 (Data Warehouse, DW) - 의사결정 지원을 위한 통합, 주젯 중심, 시계열, 비휘발성 저장소 (Inmon 모델)
2026-04-07
322. DW 4대 특징 - 주젯 지향성(Subject-oriented), 통합성(Integrated), 시계열성(Time-variant), 비휘발성(Non-volatile)
323. 데이터 마트 (Data Mart) - 특정 부서/조직 중심의 소규모 DW (Kimball 모델 - 상향식)
2026-04-07
324. ODS (Operational Data Store) - DW로 가기 전의 임시/운영 데이터 통합 영역
325. ETL (Extract, Transform, Load) 프로세스 - 소스 추출 -> 정제/변환 -> 타겟 적재
2026-04-07
326. ELT (Extract, Load, Transform) 프로세스 - 클라우드 기반 현대 아키텍처, 먼저 적재 후 웨어하우스 내에서 변환 처리
2026-04-07
327. OLTP (On-Line Transaction Processing) - 실시간 트랜잭션, 정규화된 RDB, 빠른 응답 속도
328. OLAP (On-Line Analytical Processing) - 대용량 다차원 분석, 비정규화(스타 스키마), 읽기 위주
329. OLAP 연산 (Operation) - 롤업, 드릴다운, 슬라이스, 다이스, 피벗
330. 롤업 (Roll-up) - 요약 / 드릴다운 (Drill-down) - 구체화 (계층 구조 상하 이동)
2026-04-07
331. 슬라이스 (Slice) - 특정 차원의 단일 평면 절단 / 다이스 (Dice) - 여러 차원의 작은 주사위 모양 추출
332. 피벗 (Pivot) - 보고서 축 전환 (행렬 변환)
333. 다차원 모델링 - 팩트 (Fact / 측정값)와 차원 (Dimension / 분석 기준) 구성
334. 스타 스키마 (Star Schema) - 사실 테이블 1개, 정규화 안된 다수 차원 테이블 방사형 배치 (빠른 조인, 중복 존재)
335. 스노우플레이크 스키마 (Snowflake Schema) - 차원 테이블을 3NF 정규화하여 중복 제거, 조인 복잡성 증가 눈송이 형태
336. MOLAP (Multidimensional OLAP) - 다차원 큐브(Cube) 사전 생성 구조, 초고속 검색, 큐브 갱신 비용 큼
337. ROLAP (Relational OLAP) - 관계형 DB 기반 SQL 실시간 분석, 대용량 처리에 적합
338. HOLAP (Hybrid OLAP) - MOLAP의 속도 + ROLAP의 대용량 처리 결합
339. 데이터 레이크 (Data Lake) - 원시 데이터(Raw data), 정형/반정형/비정형 모두 저장하는 스키마 온 리드(Schema-on-read) 중앙 저장소
340. 스키마 온 라이트 (Schema-on-write) - RDBMS의 입력 시점 스키마 검증
341. 스키마 온 리드 (Schema-on-read) - 데이터 레이크/NoSQL의 조회 시점 스키마 적용
342. 메타데이터 카탈로그 (Hive Metastore, AWS Glue) - 데이터 레이크 자산 검색 지원
343. 변경 데이터 캡처 (CDC, Change Data Capture) 데이터 파이프라인
344. 스트림 처리 (Stream Processing) DB 기술 (Apache Kafka, Flink) - 실시간 이벤트 데이터베이스화
345. 배치 처리 (Batch Processing) 파이프라인
346. 벡터 데이터베이스 (Vector Database) - AI, LLM, 딥러닝 임베딩(Embedding) 벡터 고속 검색에 특화 (Milvus, Pinecone, Qdrant 등)
347. 임베딩 (Embedding) 모델 - 비정형 데이터(텍스트, 이미지)를 고차원 숫자 배열로 변환
348. 유사도 검색 (Similarity Search) - 벡터 간 거리/각도 기반 의미적 탐색 연산 (키워드 일치 검색의 대안)
349. 코사인 유사도 (Cosine Similarity) - 벡터 간 각도 측정
350. 유클리디안 거리 (Euclidean Distance / L2) / 내적 (Dot Product)
351. ANN (Approximate Nearest Neighbor) 알고리즘 - 벡터 DB의 고속 근사치 검색 (정확도 일부 희생, 속도 극대화)
352. HNSW (Hierarchical Navigable Small World) - 대표적인 벡터 인덱싱 그래프 기반 ANN 알고리즘
353. RAG (Retrieval-Augmented Generation) 패턴 - 벡터 DB를 연동하여 LLM 생성의 환각(Hallucination) 방지 프레임워크
354. 벡터 인덱스 IVFFlat (Inverted File Flat)
2026-04-09
355. PGVector - PostgreSQL RDBMS의 벡터 검색 확장 플러그인 모듈
356. 클라우드 데이터 웨어하우스 솔루션 - Amazon Redshift, Google BigQuery, Snowflake 아키텍처 특성
357. 스토리지와 컴퓨팅 분리 (Separation of S/C)
2026-04-09
358. 데이터 메시 (Data Mesh)
2026-04-09
359. 데이터 패브릭 (Data Fabric)
2026-04-09
360. 데이터 가상화 (Data Virtualization)
2026-04-09
361. 다크 데이터 (Dark Data)
2026-04-09
362. 프라이버시 보존형 데이터베이스
2026-04-09
363. 그래프 신경망 (GNN) 기반 지식 연계 DB
2026-04-09
364. 데이터 리니지 (Data Lineage)
2026-04-09
365. 데이터베이스 암호화 (TDE)
2026-04-09
366. 컬럼 레벨 vs 블록 레벨 암호화
2026-04-09
367. 난독화 및 데이터 마스킹
2026-04-09
368. FPE (포맷 유지 암호화)
2026-04-09
369. 데이터베이스 감사 (DB Auditing)
2026-04-09
370. 접근 통제 정책 기반 방화벽 (DB 방화벽)
2026-04-16
371. SQL 인젝션 (SQL Injection) 공격 및 방어 수단
2026-04-16
372. 데이터 옵스 (DataOps)
2026-04-16
373. 콜드 데이터 vs 핫 데이터 계층화(Tiering) 스토리지 아키텍처
2026-04-16
374. 공간 인덱스 (Spatial Index) - Quad-tree 알고리즘
2026-04-16
375. 시계열 DB 보간 (Interpolation) 쿼리 기능
2026-04-16
376. NoSQL 파티션 톨러런스 복구 (Hinted Handoff, Anti-entropy)
2026-04-16
377. LSM-Tree (Log-Structured Merge-Tree) 저장 엔진
2026-04-16
378. 콤팩션 (Compaction) - LSM 트리 병합 구조
2026-04-16
379. 델타 인코딩 (Delta Encoding) 및 고릴라(Gorilla) 압축 알고리즘
2026-04-16
380. 시퀀스 객체 vs Auto Increment (식별자 생성 아키텍처)
2026-04-16
381. 메인 메모리 DB의 스냅샷 로깅 (Checkpointing in IMDB)
2026-04-16
382. 뉴로모픽(Neuromorphic) 인프라 연동형 AI 데이터베이스
2026-04-16
383. 그래프 데이터 분석 알고리즘 (PageRank, BFS)
2026-04-16
384. 실시간 커스터머 데이터 플랫폼 (CDP) 아키텍처
2026-04-16
385. 퍼스트 파티 고객 데이터 저장소 (CDW) 아키텍처
2026-04-16
386. 데이터 클린룸 (Data Clean Room) 보안 공유
2026-04-16
387. 영지식 증명(ZKP) 데이터 질의 프레임워크
2026-04-16
388. 분산 노드 간 클럭 스큐 (Spanner TrueTime)
2026-04-16
389. 대용량 트랜잭션 배칭(Batching) 삽입 최적화
2026-04-16
390. AWS Aurora 스토리지 로깅 분산 쿼럼 쓰기
2026-04-16
574. 데이터 마트 콘포밍 차원 (Conformed Dimension)
2026-04-16
595. 데이터 리터러시 (Data Literacy)
2026-04-16
596. 데이터 디스커버리 및 데이터 카탈로그 (Data Discovery & Catalog)
2026-04-16
597. 개인정보 비식별 조치 (K-익명성, l-다양성, t-근접성)
2026-04-16