본문 바로가기
Archive/데이터 분석 관련

[Data] 업리프트 모델링이란? - 개념편

by 다람이도토리 2024. 1. 29.
https://www.intelligencelabs.tech/5e047ef8-f811-47a8-9058-e6dfb2d5f8aa
글을 메인으로, 다양한 다른 글들을 참고하여 직접 정리하였습니다.

 

들어가기

잠깐, 회사의 입장에서 생각해보자. 서비스를 운영하고 있는 회사에서는 다음을 생각해 볼 수 있다.

- 유저의 유치를 어떻게 이끌어낼 것인가?
- 유치한 유저의 구매 전환을 어떻게 이끌어낼 것인가?

유저의 구매 전환을 위해 "광고"라는 수단을 도입할 수 있다. 자본이 무한정하다면, 사실상 아무에게나 광고를 때려도 무방할 것이나, 우리는 금전이라는 자원을 고려할 수 밖에 없다.  광고비를 절감할 수 있는 하나의 방법은 "타겟"의 적절한 선택일 것이다. 업리프트 모델링은 이를 위한 방법론에 해당된다.

어떻게 고객을 나눌 것인가?

잠깐 고객 입장이 되어 생각해보자. 우리가 어떤 상품에 대해 광고를 받았으면 다음 4가지 중 한 가지 반응을 보일 것이다.

Case 1 : 이거 이미 쓰고 있었는데 굳이 광고 뜨네 귀찮아
Case 2 : 이거 이미 쓰고 있었느데 왜 광고를 하냐고 짜증나네 담부터 안해
Case 3 : 굳이 관심도 없는거를 왜 나한테 광고하냐고 저리 가
Case 4 : 어..? 이거 관심은 있었는데.. 한번 써봐야지?

광고를 집행하는 사람 입장에서는 Case 4에만 돈을 투자하면 최적의 비용으로 최고의 효율을 올릴 수 있을 것이다. 또한, 주의 사항은 Case2에 해당하는 고객들에게는 광고를 집행해서는 안 될 것이다. 이를 바탕으로 최적의 타겟군을 찾는 것이 목표이다.

출처 : Kaggle, Why you should start using Uplift Modeling .

 

진행과정

그렇다면, 실제 Uplifting Modeling은 어떻게 진행해야 하는가?

STEP 1 : 전환 기준의 선택
STEP 2 : 학습데이터의 선택 / 광고 노출, 비노출에 의해 STEP1에서 선택한 지표에 유의미한 차이가 있나 확인
STEP 3 : 예측 모델의 설계

그럼, 모델을 어떻게 설계해야 할지 고민해보자.

우리는 STEP2에서 광고 노출과 비노출에 의해 전환 기준이 유의미하게 변화하는지를 살펴보기 위해서는 테스트 대상에 해당하는 유저들을 Target 군과 Control 군으로 나눌 것입니다. 이들의 Treatment 차이를 보면 된다.

Two-models Approach

즉, Target군과 Control군은 분리되어 있다. 광고를 보았을 때의 전환 가능성과, 광고를 보지 않았을 때의 전환 가능성을 보면 된다. Binary Classification에서는 0-1 분류 뿐만 아니라 0-1로 분류될 확률을 뱉어주는 모델들이 있는데 이를 활용하면 합리적이다.

 

즉, (광고를 보고 전환될 가능성) - (광고를 보지 않고 전환될 가능성)을 바탕으로 전환의 가능성도 볼 수 있을 것이고, 적합한 기준을 선정하면 유저군의 Clustering도 가능할 것이다. 특히 저 값이 -1에 가깝다면, 절대로 광고를 내보내면 안 된다.

실제로 전체 유저를 대상으로 Uplifting score의 그래프를 그릴 수 있을 것이다. 0보다 작은 유저들이 많다면, 그 광고가 가져올 긍정적 영향보다는 부정적 영향이 클 것이다 라고 알 수 있고, 위의 그래프처럼 0보다 큰 유저들이 많다면 그 광고가 가져올 긍정적 영향이 더 크다는 것을 알 수 있다.

 

이제, 실제로 해볼 시간입니다. 업리프트 모델링 실전편에서 뵙겠습니다.