Bootcamp

마케팅 지표 간 상관관계(correlation) 분석

sayous 2025. 6. 4. 00:44

상관관계 (Correlation)

두 변수 간의 관계를 나타내는 통계적 개념으로, 한 변수의 변화가 다른 변수의 변화와 어떤 관계가 있는지 (증가 or 감소 패턴이 있는지) 나타낸다. 상관관계는 선형 관계(linear relationship)만 측정하며, 극단값(outlier)에 민감해 데이터에 이상치가 많으면 왜곡될 수 있다. 상관관계 값이 낮다고 해서 반드시 두 변수 간에 관계가 없는 것은 아니다 (비선형 관계 가능성도 염두에 두어야 함). 
 
상관관계는 주가 지수와 경제 지표 간의 관계 분석, 혈압과 심장질환 간의 관계 분석, 광고 비용과 매출액 간 관계 분석 등 경제학, 의학, 마케팅 등 다양한 분야에서 활용된다. 
 
※ 상관관계(correlation) vs 인과관계(causation)
상관관계가 있다고 해서 반드시 인관관계가 있는 것은 아니다. 예컨대 아이스크림 판매량과 익사 사고 수가 높은 상관관계를 보인다고 쳤을 때, 이는 두 변수 간의 인과관계가 있어서가 아니고 여름철이라는 공통 요인(confounding variable)이 있기 때문이다. 
즉 상관관계는 인과관계와 다른 개념이며, 반드시 외부 요인과 논리적인 관계를 고려해야 한다.
 

상관계수(Correlation Coefficient)

상관관계의 정도는 상관계수(Correlation Coefficient, r)로 표현되며, 가장 많이 사용되는 상관계수는 피어슨(Pearson) 상관계수. 

  • r = 1 → 완전한 양의 상관관계 (한 변수가 증가하면 다른 변수도 완전비례해 증가)
  • 0.7  ≤ r < 1 → 강한 양의 상관관계
  • 0.3  ≤ r < 0.7 → 약한 양의 상관관계
  • r = 0 → 상관관계 없음 (두 변수 간 유의미한 관계가 없음)
  • -0.3 ≤ r  < 0 → 약한 음의 상관관계
  • -0.7 ≤ r < -0.3 → 강한 음의 상관관계
  •  r = -1 → 완전한 음의 상관관계 (한 변수가 증가할 때 다른 변수는 완전반비례 감소)

 
예시 코드: 종속변수(매출)에 대한 독립변수(광고비, 방문자수, 회원가입수, 구매전환율)를 상관계수를 기준으로 정하기

 
 
예시 코드: 이메일 캠페인 오픈율과 구매 전환율 간 관계 분석 / 그래프 시각화 (matplotlib)  

양의 상관관계 &rarr; 이메일을 많이 열어볼수록 구매 가능성이 높다는 것을 알 수 있다.

 

 
 
그로스 마케팅에서 상관분석은 마케팅 변수 간의 관계를 정량적으로 파악해 데이터 기반 의사결정의 기반을 제공한다. 특히 단순 상관계수를 넘어 다중 상관분석(multiple correlation analysis), 비선형 상관관계(nonlinear correlation), 시간 지연 상관관계(lagged correlation) 등의 기법을 적용하면 더욱 정밀한 분석이 가능하다. 

  • 광고비-매출 간 상관관계 분석: 광고비를 늘리면 실제 매출이 증가하는지 분석, 특정 캠페인의 채널별 효과 비교 등
  • 고객 참여 지표와 전환율 간 관계 분석: 웹사이트 체류 시간이 길수록 구매 전환율이 높아지는지, CTA 버튼 클릭률이 구매 결정에 얼만큼 영향을 미치는지 등 
  • 이메일 오픈율과 재구매율 간 관계 분석: 개인화된 이메일 캠페인이 고객 유지율을 높이는지, A/B 테스트를 통한 효과 검증 등
  • 소셜미디어 활동과 브랜드 검색량 간의 관계 분석: 특정 SNS 채널에서의 언급량 증가가 브랜드 검색량과 웹사이트 방문으로 이어지는지 분석
  • 할인율-판매량 간 상관관계 분석: 할인을 많이 할수록 판매량이 증가하는지, 할인율과 장기적인 고객 유지율 간의 관계 분석 등

단순히 '광고를 더 태우면 매출이 증가한다'는 일반적인 결론을 넘어 ROI 최적화, 전환율 개선(트래픽을 높이는 것보다 전환율 개선이 중요), 고객 세분화, 재방문율 향상 등 보다 정교한 마케팅 전략을 위한 실행 가능한 인사이트를 확보해야 함. 
 

다중 상관분석 (multiple correlation analysis)2개의 변수 간의 관계를 측정하는 단순 상관분석과 달리 다중 상관분석은 여러 개의 독립변수가 종속변수에 미치는 영향을 분석.
Spearman 상관계수 (vs. Pearson 상관계수)Pearson 상관계수는 선형 관계만 분석할 수 있어 연속형 데이터에 적합한 반면, Spearman 상관계수는 순위 기반 비선형 관계 분석이 가능.
부분 상관분석 (partial correlation analysis)특정 변수의 영향을 통제해 순수한 영향력을 평가하는 방법. 광고비와 매출 간의 관계를 분석할 때 방문자 수의 영향을 배제할 수 있음
시차 상관분석 (lagged correlation analysis)광고비 집행 후 효과가 즉시 나타나는지, 며칠 뒤에 매출 증가로 이어지는지 분석. 광고 ROI 분석 및 리마케팅 캠페인 효과 평가에 적용 가능
다변량 회귀분석 (multiple regression analysis)광고비, 방문자 수, 장바구니 추가 횟수 등 다양한 변수를 포함해 매출에 미치는 영향력 예측. 회귀 모델을 통해 각 변수의 중요도를 정량적으로 분석 가능