Topics277 [Data] 업리프트 모델링이란? - 개념편 https://www.intelligencelabs.tech/5e047ef8-f811-47a8-9058-e6dfb2d5f8aa 글을 메인으로, 다양한 다른 글들을 참고하여 직접 정리하였습니다. 들어가기 잠깐, 회사의 입장에서 생각해보자. 서비스를 운영하고 있는 회사에서는 다음을 생각해 볼 수 있다. - 유저의 유치를 어떻게 이끌어낼 것인가? - 유치한 유저의 구매 전환을 어떻게 이끌어낼 것인가? 유저의 구매 전환을 위해 "광고"라는 수단을 도입할 수 있다. 자본이 무한정하다면, 사실상 아무에게나 광고를 때려도 무방할 것이나, 우리는 금전이라는 자원을 고려할 수 밖에 없다. 광고비를 절감할 수 있는 하나의 방법은 "타겟"의 적절한 선택일 것이다. 업리프트 모델링은 이를 위한 방법론에 해당된다. 어떻게 고객.. 2024. 1. 29. [SQL] 윈도우 함수 다시 정리 * 한번 더 내용을 다시 정리합니다. 생각보다 자주 쓰이겠더라고요. 윈도우 함수란? 행간의 관계를 정의할 수 있는 함수들입니다. 가능한 것들 : 랭킹 매기기, 누적합 계산하기 등등... 1) 누적합계 계산하기 SELECT EMPNO, ENAME, SAL SUM(SAL) OVER(ORDER BY SAL ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)TOTSAL FROM EMP; OVER를 활용합니다. OVER은 기본적으로 범위를 결정합니다. SAL을 정렬한 뒤, 제한없이 맨 앞부터 해당 줄 까지 입니다. 즉 위의 구문은 급여가 가장 높은 사람부터 순차대로 급여의 누적합을 뱉어줍니다. 여기서 UNBOUNDED 대신 숫자를 넣는다면, 원하는 행 개수 만큼만 위로 올라가.. 2024. 1. 27. [Playground] 너의 레이팅이 보여 (1) 도입, 데이터 탐색 Playground 시리즈는 프로젝트나 실패에 대한 부담 없이, 자유롭게 하고 싶은 데이터 분석을 해본 일지입니다. 상세 코드 : https://github.com/swtaktak/playground/blob/main/chess_play/chess_game_analysis.ipynb 도입 이번 Playground는 하나의 영상에서 시작됩니다. https://youtu.be/c7J4-t1-J0Y?si=lM_oqj3dEcoWslIQ 최근에 저는 체스를 배우기 시작했습니다. 아직 대인전을 해본 적은 없지만 쉬운 봇 몇 개 정도 도움 없이 이길 수 있는 정도의 실력입니다. 즉, 아직 체린이일 뿐이지만 새로운 취미로 즐기고 있습니다. 그런데, 굉장히 흥미로운 영상을 보았습니다. 경기만 보고, "두 플레이어의 평균.. 2024. 1. 26. [Data] 이탈분석 - 생존분석 개괄편 들어가기 서비스 분석에서 유저의 이탈을 예측하는 것은 중요합니다. - 특정 이벤트에 의해 유저의 이탈/비이탈이 나눌 경우, 해당 이벤트의 경험 여부를 결정할 수 있다. - LTV의 예측에서는 유저의 수명과 가치의 곱으로 계산되기에 유저의 수명 또한 고려해야 한다. 즉 이탈을 탐지하고 고려하는 것은 중요한데, 여기서 이탈에 대해 고려할 것은 두 가지입니다. - 이탈을 할 유저인가? - 이탈을 한다면 언제 할 것인가? 물론, 장기적 관점에서는 결국 이탈을 할 수 밖에 없겠습니다.(일단 사람의 수명이 무한대가 아닌 이상 이탈은 수학적, 생물학적으로 확정이다.) 이탈의 탐지도 중요하나, 언제 이탈을 할 것인지에 대해 예측하는 것에 한번 초점을 두겠습니다. 여기서 이제 생존분석 이라는 것을 도입해볼 수 있습니다... 2024. 1. 24. [TIL] Dacon 하면서 자잘하게 배운 내용들 정리 이번 Dacon에 컴페티션 하나 풀어보면서 자잘하게 배운 내용 정리 * xgboost 시각화 몇년전 따릉이 때도 했지만, 실제 xgboost의 분류기준을 알기 좋아 정리 from xgboost import plot_tree from matplotlib.pylab import rcParams # 의사 결정 트리 시각화 plt.rcParams["figure.figsize"] = (75,40) plot_tree(model) plt.show() 다만, 문제는 한글 깨짐이 발생하기 때문에, 컬럼명을 모두 영어로 바꾸고 진행해야 한다. 정확하게는 matplotlib에서 한글 깨짐을 방지할수는 있지만 xgboost.plot_tree에 이것이 적용되지 않는다! * seaborn에서 차트 x축 순서 바꾸기 plt.rcP.. 2024. 1. 20. [Data] RFM 분석이란? (실전편) 이론편 : https://taksw222.tistory.com/231 Code : https://github.com/swtaktak/TIL_new/blob/main/data_analyst_practice/240119%20RFM.ipynb Data출처 : https://www.kaggle.com/datasets/thedevastator/online-retail-transaction-data 지난번 이론편에 이어 이번엔은 RFM 분석을 한번 진행해보겠습니다. 제가 직접 한번 해보겠습니다. Data 살펴보기 이번 분석 연습도 Kaggle의 데이터로 진행됩니다. 데이터의 첫 10줄을 살펴보면 다음과 같습니다. 몇몇 변수들에 대해 살펴보겠습니다. InvoiceNo : 송장 번호입니다. 즉 한 번의 구매 단위입니다.. 2024. 1. 19. 이전 1 ··· 7 8 9 10 11 12 13 ··· 47 다음