핵심 인사이트 (3줄 요약)
- 우연한 발생 배제: 향상도(Lift)는 두 항목 A와 B가 우연히 함께 나타날 확률 대비, A가 발생했을 때 B가 함께 나타날 확률의 증가율을 측정하여 규칙의 유의성을 판단합니다.
- 판단 기준 (Lift > 1): Lift가 1보다 크면 두 항목 간에 양의 상관관계(유의미한 관계)가 있으며, 1이면 독립(우연), 1보다 작으면 음의 상관관계(방해 관계)가 있음을 의미합니다.
- 마케팅 전략의 근거: 단순히 많이 팔리는 품목이 아닌, 함께 있을 때 시너지가 나는 품목을 발굴하여 교차 판매(Cross-selling) 및 상품 배치를 최적화하는 핵심 지표입니다.
Ⅰ. 개요 (Context & Background)
연관 규칙 학습(Association Rule Learning)에서 지지도(Support)와 신뢰도(Confidence)만으로는 '당연한 결과'나 '우연한 일치'를 걸러내기 어렵습니다. 예를 들어, 모든 고객이 콜라를 산다면 '라면을 사면 콜라를 산다'는 신뢰도가 매우 높게 나오지만, 이는 라면 때문이 아니라 콜라 자체가 인기 있기 때문입니다. 향상도는 이러한 기저 확률(Base Probability)을 보정하여 실제 항목 간의 상관관계를 객관화하기 위해 등장했습니다.
Ⅱ. 아키텍처 및 핵심 원리 (Deep Dive)
향상도는 "A와 B가 동시에 일어날 확률(지지도)"을 "A가 일어날 확률과 B가 일어날 확률의 곱"으로 나눈 값입니다.
[ Lift(A -> B) Calculation Architecture ]
P(A ∩ B) Support(A, B)
----------------- = -----------------------
P(A) * P(B) Support(A) * Support(B)
1. P(A ∩ B) : Observed Probability (A와 B가 실제 함께 발생한 확률)
2. P(A) * P(B) : Expected Probability (A와 B가 독립적일 때 우연히 함께 발생할 확률)
[ Diagram: Correlation Types ]
+-------------------+-----------------------+-----------------------------+
| Lift Value | Correlation (상관관계) | Meaning (의미) |
+-------------------+-----------------------+-----------------------------+
| Lift > 1 (Positive)| Positive (양의 상관) | A 구매 시 B 구매 확률이 상승 |
| Lift = 1 (Neutral) | Independent (독립) | 두 항목은 아무 상관 없음 |
| Lift < 1 (Negative)| Negative (음의 상관) | A 구매 시 B 구매 확률이 하락 |
+-------------------+-----------------------+-----------------------------+
Ⅲ. 융합 비교 및 다각도 분석 (Comparison & Synergy)
지지도, 신뢰도와의 비교를 통해 향상도의 필요성을 분석합니다.
| 지표 (Metric) | 수식 (Formula) | 의미 (Semantics) | 한계 (Limitations) |
|---|---|---|---|
| 지지도 (Support) | P(A ∩ B) | 전체 거래 중 A, B 동시 발생 비중 | 드물게 발생하는 유의미한 규칙 발견 불가 |
| 신뢰도 (Confidence) | P(B|A) | A 구매 시 B를 구매할 조건부 확률 | B 자체가 인기 품목일 경우 수치 왜곡 발생 |
| 향상도 (Lift) | P(B|A) / P(B) | 우연 대비 실질적 구매 확률 증가비 | 계산량이 상대적으로 많고 해석에 주의 필요 |
Ⅳ. 실무 적용 및 기술사적 판단 (Strategy & Decision)
- 장바구니 분석 (Market Basket Analysis): Lift가 높은 상품군(예: 맥주와 기저귀)을 인접 배치하여 동선 효율을 높이거나, 번들 상품 구성을 결정합니다.
- 추천 엔진 (Recommendation Engine): 협업 필터링(Collaborative Filtering)의 기초 로직으로 활용되어 사용자에게 '연관성 높은' 콘텐츠를 추천합니다.
- 기술사적 판단: 빅데이터 분석 시 신뢰도만으로 규칙을 확정하는 것은 위험합니다. 반드시 향상도를 병행 확인하여 '가짜 규칙(Spurious Relationship)'을 제거하고 실질적인 비즈니스 통찰을 도출해야 합니다.
Ⅴ. 기대효과 및 결론 (Future & Standard)
향상도는 데이터 마이닝의 결과물에 신뢰성을 부여하는 필터 역할을 합니다. 향후 실시간 스트리밍 분석 환경에서도 FP-Growth 등 고속 알고리즘과 결합하여 즉각적인 개인화 마케팅을 가능케 할 것입니다. 결론적으로 향상도는 데이터 간의 '연결의 품질'을 정의하는 표준 지표로 기능합니다.
📌 관련 개념 맵 (Knowledge Graph)
- 상위 개념: 연관 규칙 학습(Association Rule Learning), 비지도 학습
- 유사 개념: 코사인 유사도(Cosine Similarity), 자카드 지수(Jaccard Index)
- 하위 기술: Apriori 알고리즘, FP-Growth 알고리즘
👶 어린이를 위한 3줄 비유 설명
- 편의점에서 껌을 사는 사람이 콜라를 사는 일이 아주 많다고 해봐요.
- 그런데 알고 보니 원래 모든 사람이 콜라를 많이 사는 거라면, 껌 때문에 콜라가 팔린 건 아니겠죠?
- '향상도'는 진짜로 껌 때문에 콜라가 더 많이 팔린 건지, 아니면 그냥 우연인지 똑똑하게 알려주는 점수예요.