본문 바로가기

Topics277

[Data] 데이터 분석 용어 - 이용자 및 매출에 대한 지표 요약 출처 [1] https://you-yeon.tistory.com/29 [2] https://team.postype.com/post/9405656 [3] https://mixpanel.com/ko/resources/how-to-calculate-lifetime-value/ * 이용자 및 매출에 대한 지표를 간단하게 요약하였습니다. 각각에 대한 세부적 이해에 앞서 먼저 큰 그림을 잡고 넘어가고자 합니다. Q. 특정 서비스를 사용하는 유저의 수를 어떻게 셀 것인가? 단순히 접속 카운트로만 센다? 그러나 여기에는, 한 가지 문제가 존재한다. 하나의 유저가 핸드폰으로도, 컴퓨터로도 다양한 방식으로 여러 번 접속할 수 있을 것이다. 이러한 케이스를 어떻게 가중치를 두고, 어떻게 다룰 것인가에 대해 정리해볼 필요가 .. 2021. 12. 10.
[TIL] 간단한 ML Serving 방법 / Flask (1) Flask 를 통한 ML Serving 개요 코드 출처 https://github.com/bharatc9530/Machine-Learning/tree/master/Model-Deployment-Using-Flask 개요 기본적인 구조는 다음과 같다. FRONT(화면에버 보여지는 것) Flask ML/DL Model 즉 FRONT에서 값을 입력하면, 그 값을 받아 Flask에서 처리후 이를 넘겨 학습한다. 학습한 결과물을 다시 가져와서 Flask에서 처리 후에 FRONT로 보내버린다. 이 과정을 만드는 것이 Flask를 통한 ML Serving의 간단한 개요라고 할 수 있을 것이다. Flask의 아주 간단한 사용법 Flask의 구조도 이전에 보았던 django와 비슷하나, 훨씬 더 간편하게 serving시.. 2021. 12. 6.
[Stat] 범주형 변수에 대한 검정 범주형 변수에 대한 검정을 한다? 범주형 변수에 대한 통계적 검정을 한다는 것의 의미는 분포에 대한 검정을 의미한다. 이는, 우리가 예상하는 범주형 변수의 분포랑, 실제 관찰된 변수의 분포가 동일한지, 다른지 해석을 통해 통계적 Insight를 찾아내려는 것을 말한다. 예시1> 주사위가 하나 있다. 이 주사위를 던져, 모든 눈이 균일하게 나온다고 할 수 있을까? 예시2> 상품 A, B, C의 선호도에 대해 조사해보았다. 상품에 대한 선호도는 남성, 여성 상관없이 동일한 선호도 분포를 가지고 있을까? 이러한 질문들에 대해 답하고자 할 때 카이제곱검정을 이용하게 된다. 카이제곱 분포의 이용 범주형 변수에 대해 검정을 할 때는, 카이제곱분포를 활용한다. 카이제곱 분포를 바탕으로 관찰된 빈도와, 기대하는 빈도의.. 2021. 11. 17.
[TIL] Python으로 시간 다루기 WAVVE Coding Test 참패당했다... 물론 평소 한거랑 조금 다른 계열의 분석 문제라는 핑계는 있지만.. 핑계는 핑계고 아무튼 시간을 다룬다던가, pivot 기능이 덜 숙지 되었다는 것이 부끄럽다. 그런 의미로 시간을 다루는 법을 한번 정리하였다. https://github.com/SeongwonTak/TIL_swtak/blob/master/Python_handling_time_series.ipynb GitHub - SeongwonTak/TIL_swtak: Today, I learned. Today, I learned. Contribute to SeongwonTak/TIL_swtak development by creating an account on GitHub. github.com 2021. 11. 2.
[Data] 범주형 변수의 Clustering 범주형 변수를 Clustering 할 수 있을것인가? 참고자료 [1] Zhexue Huang, A Fast Clustering Algorithm to Cluster Very Large Categorical Data Sets in Data Mining [2] Zhexue Huang, Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values [3] https://medium.com/geekculture/the-k-modes-as-clustering-algorithm-for-categorical-data-type-bcde8f95efd7 [4] https://www.analyticsvidhya.com/blo.. 2021. 10. 28.
[TIL] 회귀분석의 가정 개요 회귀모델이 정말 적절했는지를 따져보기 위한 검토 방법중의 하나로 회귀 모델의 기본 가설이 잘 성립했는지를 확인해 보는것이 그 방법이 될 수 있을 것이다 회귀 분석의 기본 가정 4가지에 대해 알아보고 이에 대한 여러 검증 방법 및 시각화 방법에 대해 정리해본다. 선형회귀분석의 가정 선형회귀분석의 기본 4가지 가정은 다음과 같다. (1) 정규성 : 잔차가 평균이 0인 정규분포를 띈다. (2) 독립성 : 잔차 사이에는 상관관계가 없이 독립이어야 한다. (3) 등분산성 : 잔차의 분산은 입력변수와 무관하게 일정해야 한다. (4) 선형성 : 입력변수와 출력변수 사이에는 선형적인 관계를 띄어야 한다. 주의사항! 여기서 독립변수의 정규성이나 독립성 등을 따지는 것이 아니라 잔차의 정규성, 독립성을 따져야 한다... 2021. 10. 27.