RFM 분석이란?
기본적인 RFM의 정의는 다음과 같다.
Recency : 얼마나 최근에 구매했는가?
Frequency : 얼마나 자주 구매했는가?
Monetary : 얼마나 많은 금액을 지출했는가?
이 3가지 지표로 사용자들의 분포를 확인하거나 사용자들에게 등급을 부여하여 clustering을 시키고, 이를 바탕으로 Insight를 획득하는 것이 RFM 분석이다.
이 지표를 사용할 경우 생각할 수 있는 다양한 장점들은 다음과 같다.
- 최근 구매가 많다 -> 고객의 반응이 좋다.
- 구매 빈도가 높다 -> 해당 고객들은 상품에 대한 참여율도 높고, 만족도도 높아 자주 action이 발생한다.
- 구매 금액을 바탕으로 유저의 등급을 나눠서 접근할 수 있다.
- RFM을 바탕으로 고객을 여러 세그먼트로 나눌 수 있다. (cohort 기반의 모델에 좋은 선택지이다)
RFM 분석의 Process
RFM에서 가장 중요한 것은 R, F, M 항목 별로 "등급을 부여하는 것"이다.
서비스 형태에 맞게 가치가 높은 순서대로 정렬 후 다양한 방법으로 각 항목에 등급을 매길 수 있을 것이다.
등급을 매기는 다양한 방법
- 최댓값과 최솟값을 이용하여 3~5개 정도의 범위로 나눠 1,2,3등급을 부여한다.
- 분위수를 활용한 상대평가로 등급을 부여한다.
이렇게 등급을 매기고 유저를 분류하면 여러 인사이트를 얻을 수 있을 것이다.
Examples)
1. 최근 구매 등급 하, 구매빈도/구매금액 상 -> 이탈한 중요 유저
2. 최근 구매 등급 상, 구매빈도/구매금액 하 -> 접속은 해도 구매가 덜 일어나는 유저
3. 최근 구매 등급/구매 빈도/구매 금액 하 -> 서비스에 크게 관심이 없는 유저
산업군에 맞게 다양한 해석이 가능하여 특정 캠페인을 진행할 때 적합한 유저군을 뽑아내기에 간단하다.
또한 RFM 각 등급에 따라 고객별 점수 산출이 가능하다. 이를 토대로 고객의 가치를 파악해볼 수 있다.
각 항목별로 가중치를 두어 등급을 계산하는 방식등을 고려할 수 있다. (weighted sum)
RFM 분석의 한계
다양한 한계점들을 고려할 수 있다.
- RFM 3가지 축으로 나눠 등급을 매기는데, 이것이 유효하기 위해서는 3가지 항목의 "독립성"이 중요하다.
그러나, 변수간 상호 독립성이 보장되기는 어렵다. 오히려 연관성이 서로 있다고 봐야 할 것이다.
- 구매에 대한 분석으로는 유효하나, 다른 마케팅 전환(메일 응답률, 설치 등)에 대해서는 부적합한 모델이다.
- 해당 모델은 신규 유저를 대상으로 한 분석에는 부적합하다.
- RFM를 각각 몇 단계로 나눌 것인지, 집계 기간은 어떻게 설정할 것인지에 대한 면밀한 고려가 필요하다.
- 위의 3가지 이외 다양한 변수들이 실제 상품 구매에 영향을 끼칠 수 있는데, 3가지로만 판단한다.
대신, 위의 3가지로만 판단한다는 것은 여러 산업군에서 다양하게 적용 가능하며, 간단한 방법으로 고객 성향을 파악하는데에는 유용하게 사용될 수 있다.
RFM 연습편에서는 실제 데이터를 바탕으로 인사이트를 획득하고, RFM을 다양한 방법으로 적용해보고자 한다.
'Archive > 데이터 분석 관련' 카테고리의 다른 글
[Data] 이탈분석 - 생존분석 개괄편 (1) | 2024.01.24 |
---|---|
[Data] RFM 분석이란? (실전편) (1) | 2024.01.19 |
[Data] A/B Test 사용해보기 : Cookie-Cats (0) | 2024.01.16 |
[Data] Retention (2) | 2024.01.15 |
[Data] CLV (0) | 2024.01.13 |