본문 바로가기

Archive171

[Data] A/B 테스트 개념 다지기 https://taksw222.tistory.com/229 이 글을 통해 A/B 테스트의 실제 예시를 다룬 적이 있습니다. 이 글에서는 조금 더 이론적인 부분이나 생각할 부분에 집중하여 A/B 테스트를 한번 더 알아보겠습니다. 들어가기 우리가 A/B 테스트를 진행할 때 단순히 A안과 B안을 비교해서 어디가 더 낫네, 그래서 뭘 하네 이렇게 단순히 끝내고 싶지는 않을 것입니다. 자, 데이터 분석가가 아닌 그냥 결과를 보는 사람 입장에서 생길 수 있는 다양한 의문점들을 봅시다. - 겨우 1% 차이인데, 이거 의미 있는거 맞아? - 이거 정말 A를 B로 바꾸면 개선되는거 맞지? 우연은 아니지? - 다른 고객들에게 적용해도 되는 이야기지? 등등, 다양한 합리적인 의심(?!)을 할 수 있습니다. 우리는 이것에 대.. 2024. 1. 31.
[Data] 업리프트 모델링이란? - 예제편 아직, 개념편을 보지 않으셨다면 https://taksw222.tistory.com/237 데이터 출처는 https://www.kaggle.com/code/kriyeneekutbay/marketing-uplift 간단한 예제를 통해, 업리프트 모델링을 실제로 하는 법을 알아봅시다. 변수 설명입니다. recency : 가장 마지막 구매일로부터 지난 달 수 history : 현재까지 총 구매액 user_discount : 할인을 받은 적이 있는가? 있으면 1, 없으면 0 user_bogo : 1+1을 받은 적이 있는가? (one get one 이 1+1) zip_code : 우편 번호 구분(지역 구분) is_referral : 추천 채널로부터 고객을 유입받은 것인지 channel : 고객이 사용하는 채널 o.. 2024. 1. 29.
[Data] 업리프트 모델링이란? - 개념편 https://www.intelligencelabs.tech/5e047ef8-f811-47a8-9058-e6dfb2d5f8aa 글을 메인으로, 다양한 다른 글들을 참고하여 직접 정리하였습니다. 들어가기 잠깐, 회사의 입장에서 생각해보자. 서비스를 운영하고 있는 회사에서는 다음을 생각해 볼 수 있다. - 유저의 유치를 어떻게 이끌어낼 것인가? - 유치한 유저의 구매 전환을 어떻게 이끌어낼 것인가? 유저의 구매 전환을 위해 "광고"라는 수단을 도입할 수 있다. 자본이 무한정하다면, 사실상 아무에게나 광고를 때려도 무방할 것이나, 우리는 금전이라는 자원을 고려할 수 밖에 없다. 광고비를 절감할 수 있는 하나의 방법은 "타겟"의 적절한 선택일 것이다. 업리프트 모델링은 이를 위한 방법론에 해당된다. 어떻게 고객.. 2024. 1. 29.
[Playground] 너의 레이팅이 보여 (1) 도입, 데이터 탐색 Playground 시리즈는 프로젝트나 실패에 대한 부담 없이, 자유롭게 하고 싶은 데이터 분석을 해본 일지입니다. 상세 코드 : https://github.com/swtaktak/playground/blob/main/chess_play/chess_game_analysis.ipynb 도입 이번 Playground는 하나의 영상에서 시작됩니다. https://youtu.be/c7J4-t1-J0Y?si=lM_oqj3dEcoWslIQ 최근에 저는 체스를 배우기 시작했습니다. 아직 대인전을 해본 적은 없지만 쉬운 봇 몇 개 정도 도움 없이 이길 수 있는 정도의 실력입니다. 즉, 아직 체린이일 뿐이지만 새로운 취미로 즐기고 있습니다. 그런데, 굉장히 흥미로운 영상을 보았습니다. 경기만 보고, "두 플레이어의 평균.. 2024. 1. 26.
[Data] 이탈분석 - 생존분석 개괄편 들어가기 서비스 분석에서 유저의 이탈을 예측하는 것은 중요합니다. - 특정 이벤트에 의해 유저의 이탈/비이탈이 나눌 경우, 해당 이벤트의 경험 여부를 결정할 수 있다. - LTV의 예측에서는 유저의 수명과 가치의 곱으로 계산되기에 유저의 수명 또한 고려해야 한다. 즉 이탈을 탐지하고 고려하는 것은 중요한데, 여기서 이탈에 대해 고려할 것은 두 가지입니다. - 이탈을 할 유저인가? - 이탈을 한다면 언제 할 것인가? 물론, 장기적 관점에서는 결국 이탈을 할 수 밖에 없겠습니다.(일단 사람의 수명이 무한대가 아닌 이상 이탈은 수학적, 생물학적으로 확정이다.) 이탈의 탐지도 중요하나, 언제 이탈을 할 것인지에 대해 예측하는 것에 한번 초점을 두겠습니다. 여기서 이제 생존분석 이라는 것을 도입해볼 수 있습니다... 2024. 1. 24.
[TIL] Dacon 하면서 자잘하게 배운 내용들 정리 이번 Dacon에 컴페티션 하나 풀어보면서 자잘하게 배운 내용 정리 * xgboost 시각화 몇년전 따릉이 때도 했지만, 실제 xgboost의 분류기준을 알기 좋아 정리 from xgboost import plot_tree from matplotlib.pylab import rcParams # 의사 결정 트리 시각화 plt.rcParams["figure.figsize"] = (75,40) plot_tree(model) plt.show() 다만, 문제는 한글 깨짐이 발생하기 때문에, 컬럼명을 모두 영어로 바꾸고 진행해야 한다. 정확하게는 matplotlib에서 한글 깨짐을 방지할수는 있지만 xgboost.plot_tree에 이것이 적용되지 않는다! * seaborn에서 차트 x축 순서 바꾸기 plt.rcP.. 2024. 1. 20.