전체 글277 [Data] p-value Revisited, p-hacking이란? 참고 : https://yeomko.tistory.com/37 p-value, 검정력에 대한 내용을 다시 복습해보며, p-hacking에 대해 알아보자 p-value의 해석 및 p-hacking이란? 아무튼, 분석을 했다고 생각해보자. 유의 수준이 0.05고.. p값은 0.05보다 작게 나왔다. 주어진 데이터에서 귀무가설이 참일 확률은 5% 이하....? 이렇게 생각하면 큰일난다! 우리는 p-value를 해석할때에는, 귀무가설이 참이라고 할 때, 현재의 데이터를 얻을 확률이라고 생각해야 한다. 이전에, p-value에 대해 알아보았을때 p-value의 정의를 내가 뽑은 통계량이 귀무가설에 따라 나올 확률이 몇%인가? 라고 했었다. 이것이 귀무가설이 참일 확률을 말하지는 않는다. 주의하자! 즉, p-val.. 2021. 5. 27. [Prob] 우도(가능도) 최대우도 추정법 참고자료 및 출처 1. 프로그래머스 데브코스 인공지능과정 6주차 내용 2. https://www.youtube.com/watch?v=sOtkPm_1GYw 3. https://jjangjjong.tistory.com/41 4. http://contents.kocw.or.kr/KOCW/document/2015/chungbuk/najonghwa/3.pdf 5. https://everyday-image-processing.tistory.com/30 들어가면서 다음과 같은 문제를 풀고 싶다. 공이 200개가 있는 항아리가 있다. 여기에는 분명하게, 흰 공과 파란 공만이 섞여 있다. 여기에서 공을 20개를 뽑았다. 뽑은 20개의 공 중 흰 공은 8개다. 전체 항아리에는 파란 공이 몇 개 들어 있을까? 우리는 본능적.. 2021. 5. 27. [Stat] 선형회귀분석이란? 선형회귀분석이란? 회귀는, x값에 따른 y값이 주어졌을 때, 이들의 경향을 가장 잘 대표하는 함수를 찾는 문제이다. 특별히, 연속형 변수에서 선형 함수를 찾는 문제를 선형회귀분석 이라고 생각하면 편하다. ex) 키와, 몸무게의 비교 최소제곱법과 오차함수 해당 파트내용 출처 : https://acdongpgm.tistory.com/70 생각해볼 수 있는 가장 대표적인 문제, 그러면 x와 y 관계가 어느 정도 선형성은 띄는데, 어느 직선이 가장 두 변수의 관계를 설명할 것인가? 그리고 오차는 어느정도인가? 두 문제를 생각해봐야 한다. 오차함수와 SSE, SSR, SST 선형회귀에서, 사용하는 오차함수는 잔차제곱합(SSE)라고 불리는 것이다. 실제값과 예측 값의차이를 제곱한 것을 모두 더한 것이 SSE다. 여.. 2021. 5. 26. [Stat] Inverse CDF technique 프로그래머스 Week 6 Day 1 내용 중 정리. 추가참고 자료 : https://m.blog.naver.com/jinis_stat/221648391742 Inverse CDF technique를 적용하는 이유 샘플링 상황을 고려해보자. 연속 확률 분포에서 확률 밀도 함수는 확률변수 정의역내 x가 주어지면 확률값 P(x)를 돌려주게 된다. 그런데, 샘플을 뽑기 위해서 필요한 것은 P(x)가 아닌 x이다. 다시 말해 확률 밀도 함수 하나 만으로는 샘플링이 불가능하다. 따라서, 샘플을 뽑기 위해서는 output이 x가 되는 함수를 정의해야 한다. 대표적인 것은 Inverse CDF를 활용하는 것이다. Inverse CDF의 활용 근거, 샘플링의 조건 모든 확률분포의 누적 분포 함수는 [0, 1] 사이의 균.. 2021. 5. 24. [DevCourse] Monthly EDA Project(3) 최종 결과 및 회고 http://taksw222.pythonanywhere.com/ Monthly Project taksw222.pythonanywhere.com 아무튼, 두 개의 과정을 통해 만든 EDA 최종 결과물은 다음과 같다. 배운점, 부족한 점들을 쭉 적어보면 다음과 같다. - 원하는 모양의 차트를 찾기 위해 다양하게 찾아보았고, 이 덕분에 radar chart, 도넛 차트, heat map을 삼각형 모양으로 그리기 등을 할 수 있었다. - 추가적인 분석을 위해 다른 데이터를 가져와서 쓰는 등 여러 시도를 하였다. - 단순히 원페이지에서 끝내지 않기 위해 CSS를 어떻게 적용해야하는지 찾아보았고, 그리드를 나눠서 표현하는 법에 대해 배웠다. - 배포를 위해서 정말 많은 것을 찾아보았으나, 배포를 하는 것만 성공했지.. 2021. 5. 22. [DevCourse] Monthly EDA Project (2) 배포는 어떻게 할 건가? EDA를 실시한 이후, (추가를 하긴 했으나) Django를 통해 페이지를 만드는데는 문제가 적었으나, 가장 어려운 점은 바로 '배포'를 하는 것이었다. 많은 블로그 등을 통해 방법을 찾아보며 성공하였기에 어떻게 했는지 그 방법을 정리해본다. '배포'? 왜? 일단, 우리가 다른 사람들에게 결과물을 보여줄때 이 쪽을 아는게 아닌 이상 주피터 노트북으로 보세요, 깃에 들어가세요 할 수는 없다. 따라서, Django나 Flask를 사용하여 사이트 형태로 만드는 것이 필요하다. 문제는, 우리가 Django를 활용하여 사이트를 만들어서 테스트를 해도, 우리 컴퓨터에 만들어둔 가상환경 상에서만 확인이 가능하다는 것이 문제이다. 즉, 배포 작업을 통해 다른 사람도 이것을 확인하게 해줘야 한다. 이 과정에서 배포가 들.. 2021. 5. 22. 이전 1 ··· 33 34 35 36 37 38 39 ··· 47 다음