Topics277 [Data] RFM 분석이란? (이론편) RFM 분석이란? 기본적인 RFM의 정의는 다음과 같다. Recency : 얼마나 최근에 구매했는가? Frequency : 얼마나 자주 구매했는가? Monetary : 얼마나 많은 금액을 지출했는가? 이 3가지 지표로 사용자들의 분포를 확인하거나 사용자들에게 등급을 부여하여 clustering을 시키고, 이를 바탕으로 Insight를 획득하는 것이 RFM 분석이다. 이 지표를 사용할 경우 생각할 수 있는 다양한 장점들은 다음과 같다. - 최근 구매가 많다 -> 고객의 반응이 좋다. - 구매 빈도가 높다 -> 해당 고객들은 상품에 대한 참여율도 높고, 만족도도 높아 자주 action이 발생한다. - 구매 금액을 바탕으로 유저의 등급을 나눠서 접근할 수 있다. - RFM을 바탕으로 고객을 여러 세그먼트로 나.. 2024. 1. 17. [Data] A/B Test 사용해보기 : Cookie-Cats 내 블로그에서 직접 이를 실험하면 좋겠지만 유의미하게 로그 획득을 정확하게 하기 어려울 것이기에 캐글에 존재하는 다른 데이터로 A/B Test 연습을 대체하였다. 아래 깃헙 링크를 통해 조금 더 구체적인 세부 코드들을 확인할 수 있다. https://github.com/swtaktak/TIL_new/blob/main/data_analyst_practice/240116_AB_Test_Practice.ipynb Data Link : https://www.kaggle.com/datasets/zahrazolghadr/ab-test-cookie-cats 위의 데이터는 "Cookie-Cats"라는 게임의 데이터이다. 문제 상황 게임 초반의 허들을 변화했을 때, 리텐션에 어떤 변화가 있을지를 살펴보는 A/B 테스트를.. 2024. 1. 16. [파이썬 압수] (3) SQL로만 리텐션 구하기 1편 https://taksw222.tistory.com/225 2편 https://taksw222.tistory.com/226 1,2편에 데이터 설명이 있습니다. 3편에서는 리텐션 쿼리 짠 삽질후기만 기록됩니다. 이번에는 월간 리텐션 구하기다. Retention 구하기 1단계 / 각 유저별로 최초 구매 시점 구하기 script = """ SELECT user_id, min(substr(event_time, 1, 7)) as first_month FROM events WHERE event_type = 'purchase' GROUP BY user_id ORDER BY user_id """ cur.execute(script) result = cur.fetchmany(10) print(result) 유저별로 .. 2024. 1. 16. [파이썬 압수] (2) SQL로만 Funnel 구하기 (1)에 이어서 진행입니다. (1) https://taksw222.tistory.com/225 퍼널 구하기 퍼널을 구하기 위해, 우선은 이벤트명의 종류를 정확히 파악해야 한다. script = """ SELECT distinct(event_type) FROM events """ cur.execute(script) result = cur.fetchall() print(result) 결과는 view -> cart -> purchase임을 직관적으로 알 수 있다. 이렇게 3단계의 퍼널이 구성되어 있다. 아쉽게도 접속과 관련된 기록은 없는 것이 문제다. 또한 일부 데이터는 view->purchase일수도 있으나, 이러한 케이스는 일단 무시하고 진행할려고 한다. 그런데.. 컬럼명을 확인할 수 없어 어쩔수 없이 파.. 2024. 1. 15. [파이썬 압수] (1) SQL로만 DAU, MAU, stickness 구하기 파이썬 압수! 무슨 청천벽력 같은 소리냐고요? 지금부터 저는 이번 미니 플젝을 끝날 때까지 해당 미니 플젝에서는 파이썬은 최소한만 사용 가능합니다. 오로지 SQL로만 지표를 뽑습니다. 물론 실제 데이터를 저장하고 시각화하거나 연동에는 파이썬을 써야 하지만 모든 데이터 추출과 가능한 모든 전처리는 SQL로만 진행합니다. 그리고 가장 최악을(?) 가정하여 딱 메인 테이블 하나만 create 되었다는 상황하에 진행합니다. 함부로 subtable 못만드는 최악의 상황이라고 해둡시다. 하하... 압수 프로젝트에서는 Kaggle의 다음 데이터를 활용합니다. https://www.kaggle.com/datasets/yaybeedee/multi-category-online-store-funnel Multi Catego.. 2024. 1. 15. [Data] Retention 왜 Retention을 보려고 하는가? Retention은 사용자가 서비스에 최초 가입한 이후 해당 서비스를 지속적으로 사용하는가를 측정하기 위한 지표이다. 사용자들이 충분히 서비스를 사용하지 않고 "이탈"한다면 의미가 없을 것이다. 기본적으로 AARRR에서 가장 먼저 개선을 고려해야 하는 사항이기도 하다. Remark. AARRR이란? 유저의 이용 사이클을 체계화한 프레임워크 A : Acquisition (사용자 획득) A : Activation (사용자 활성화) R : Retention (사용자의 유지) R : Revenue (매출) R : Referral (타 사용자에게 추천, 전파) Retention의 종류 이러한 Retention도 어떻게 보냐에 따라서 다양한 기준들이 존재한다. (1) Clas.. 2024. 1. 15. 이전 1 ··· 8 9 10 11 12 13 14 ··· 47 다음