본문 바로가기

전체 글277

[0607] TIL * 베타분포에 대해서 배웠다. 일어날 횟수에 대해 물어볼 수도 있지만, 일어날 확률에 대해서도 물어볼 수 있다는 것을 알게 되었다. * 과제에 대해 논의하면서, 말도 안되는 실수를 또 범했음을 깨달았다. 등호 빼먹지 말자. 2021. 6. 7.
[Prob] 베타분포와 디리클레분포 프로그래머스 DevCouse 인공지능 과정 Week7 - Day1 관련 추가참고자료 : 데이터사이언스 스쿨 수학편 8.7. https://datascienceschool.net/02%20mathematics/08.07%20%EB%B2%A0%ED%83%80%EB%B6%84%ED%8F%AC%2C%20%EA%B0%90%EB%A7%88%EB%B6%84%ED%8F%AC%2C%20%EB%94%94%EB%A6%AC%ED%81%B4%EB%A0%88%20%EB%B6%84%ED%8F%AC.html#id2 8.7 베타분포, 감마분포, 디리클레분포 — 데이터 사이언스 스쿨 .ipynb .pdf to have style consistency --> datascienceschool.net 베타분포 베타분포의 정의 베타분포는 a와.. 2021. 6. 7.
[SQL] HackerRank - Population Census 출처 : https://www.hackerrank.com/challenges/asian-population/problem Population Census | HackerRank Query the sum of the populations of all cities on the continent 'Asia'. www.hackerrank.com 가장 기본적인 Join문 상황을 배우기. city의 countrycode와 country의 code가 동일한것끼리 합쳐주는 join 사용하여 간단한 select문을 적용한다. select 자체에서도 함수를 적용하여 값만 뽑아낼 수 있음을 잊지 말자. SELECT SUM(CITY.POPULATION) FROM CITY JOIN COUNTRY ON CITY.COUNTRYCO.. 2021. 6. 4.
[TIL] 0603 TIL 과제를 하면서, 회귀 문제를 다시 연습해보았다. 그런데, R^2 가 18%가 나오는 이상 현상이 발생했다. 데이터를 뜯어본 결과, 분명히 값은 크게 차이나지 않게 나오고 있는데 전체적으로 예측값이 넓게 퍼진 것이 아닌 상황인지라 분류를 써야 하나 다른 모델을 써야 하나 고민했다. 그러나, 선형 회귀에서 R^2만이 모든 지표가 되지는 않을 것이다. 물론, R^2값이 전체적으로 회귀직선으로 설명할 수 있는 정도를 나타낼 것이나, 문제는 설명하는 y값이 완벽한 선형 상황을 만들고 있지는 않았다. 그러나 Mean Absolute Mean을 활용한 결과, 그 오차는 크게 나타나지 않았다. R^2 값, 말고도 다양한 상황에 맞게 다양한 metric를 사용하는 것이 중요하다는 것을 알게 되었다. 2021. 6. 3.
[ML] 배치 학습 vs 온라인 학습 참고(1) : https://gooopy.tistory.com/123 참고(2) : https://stickie.tistory.com/44 배치학습 배치학습이란, 시스템이 점진적으로 학습하지 않고, 가용한 데이터를 모두 사용해 훈련하는 학습법이다. 즉, 시스템을 훈련시키고 그런 다음 제품 시스템에 적용하면 더 이상의 학습 없이 실행된다. 즉 학습한 것을 단지 적용만 하는 것으로, 오프라인 학습(Offline Learning)이라고도 한다. 배치학습의 경우, 새로운 데이터에 대해 학습하기 위해서는 전체 데이터를 사용하여 시스템의 새 버전을 다시 처음부터 훈련해야 한다. 온라인학습 반면, 온라인 학습의 경우에는 데이터를 순차적으로 1개씩 혹은 미니배치라고 부르는 작은 묶음 단위로 주입하여 시스템을 훈련시킨다.. 2021. 6. 3.
[Cal] Matrix Calculus Review 행렬 미분 Review (프로그래머스 Week6-Day4 과정) 추가 참고자료 : (수식 사진은 여기서 가져왔습니다) https://datascienceschool.net/02%20mathematics/04.04%20%ED%96%89%EB%A0%AC%EC%9D%98%20%EB%AF%B8%EB%B6%84.html# 4.4 행렬의 미분 — 데이터 사이언스 스쿨 지금까지는 스칼라값을 입력으로 받아 스칼라값을 출력하는 함수를 생각했다. 이제부터는 벡터나 행렬을 입력으로 받아서 벡터나 행렬을 출력하는 함수를 살펴본다. 여러개의 입력을 가지는 datascienceschool.net (사실상 다변수 미분이라 표현하고 싶지만, 행렬 자체로 빠르게 표현하기 좋은 상황이 많다) 여러개의 입력을 가지는 다변수 함수이거나, .. 2021. 6. 3.