본문 바로가기

Topics277

[SQLD] Grouping 함수, Window 함수 정리 (1) * 추후 SQLD, SQLP 응시 계획이 있긴 하다. 그거와 별도로 SQL을 좀 더 다루는 연습을 할겸 Grouping 함수, Window 함수를 정리. Rank 함수 Rank : 순위를 추출, 동순위일 경우 인원수 만큼 넘기고 다음 순위로 넘어감 (2위가 2명이면 다음은 4위) Dense_Rank : 순위를 추출, 동순위여도 인원수 만큼 넘기지 않고 바로 다음 순위 부여(2위가 99명이어도 다음은 3위) SELECT EMPLOYEE_ID, SALARY, RANK() OVER (ORDER BY SALARY DESC), DENSE_RANK() OVER (ORDER BY SALARY DESC) FROM EMPLOYEES; 비율 함수 Percent_rank : 상위 몇 % 인지 추출, 파티션 내의 비율을 따질.. 2023. 12. 27.
[프로그래머스] 숫자 변환하기 (Level 2) Problems https://school.programmers.co.kr/learn/courses/30/lessons/154538 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr Idea 일단은, 수학적으로 일반해를 구하는 것은 좋지 않습니다. 사실 언제 더해주는 것이 좋을지 모르니까요. 다만 중요한 아이디어는, 값은 무조건 단조적으로 strictly하게 증가한다 입니다. 따라서, 이미 목표값을 넘는 것에 대해서는 더 연산을 시도해볼 이유가 전혀 없습니다. 이에 따라, 특정 수에 n을 더하거나, 2배, 3배 했을 때 목표값인 y 이하인 값들만 담아주면 됩.. 2023. 12. 26.
[TIL] 0812 아침스터디 - 비모수적 방법 (1) * 모수적 방법과 비모수적 방법 모수적 방법 - 모집단의 분포에 대한 가정을 하고, 그 가정하에서 검정을 실시한다. EX) 정규성 검정 or 중심극한정리에 의해 모집단의 분포를 정규분포라고 볼 수 있을 경우. 비모수적 방법 - 모집단의 분포를 가정하지 않는다. EX) 표본의 크기가 10개 이하로 매우 작을 경우, 모집단의 분포가 정규분포가 아닐 경우 (혹은 변환 불가) 비모수적 방법의 예시 (1) 부호검정 (sign test) 중앙값을 통해 가설을 검정하는 방법으로, 단일표본 t-test에 대응되는 비모수적 방법이다. 즉, 부호 검정을 통해 단일 집단에서의 검정, 대응 표본에 대한 검정을 진행할 수 있다. 단일 집단에서의 검정 : 모집단의 중앙값 M이, 특정값과 동일한지에 대한 검정 대응 표본에대한 검정.. 2022. 8. 12.
[TIL] 0808 아침스터디 - 다차원척도법 (MDS) 다차원 척도법 (Multidimensional Scaling, MDS) MDS란, 다변량 데이터의 특성 및 구조를 파악하여, 원래 차원보다 낮은 차원에 시각화를 시키는 방법이다. 이 때, 개체간의 유사성 / 비유사성이 드러나도록 진행한다. 즉, 개체간의 유사성 / 비유사성이 잘 표현되도록 "거리"를 시각화하는 작업을 하게 될 것이다. 중요한 점은, 거리 관계가 잘 유지되어야 한다는 점이다. 거리를 계산하기 위해, 일반적으로는 Eucliden-metric을 쓰긴 하나, Manhattan distance 등 필요에 따라 다른 distance를 이용할 수 있다. Python Example 코드를 통해서 어떻게 쓰는지 확인해보자. # 출처 : https://stackabuse.com/guide-to-multid.. 2022. 8. 8.
[TIL] 0805 아침스터디 - 나이브 베이즈 복습 Naive Bayes란? 원리 - 베이즈 정리 베이즈 정리란, 사전확률과 사후확률의 관계를 나타내는 정리이다. 사전확률은, 특정 사건이 일어나기 전에 우리가 구하고자 하는 사건의 확률을 의미한다. (예시 - 어떤 질병에 걸릴 확률) 여기에 증거, 즉 추가적인 조건을 붙힌다면, 이 때 확률은 어떻게 될지를 구하는 것이, 베이즈 정리이다. 다시 말해, A -> B라는 관계가 있을 때, B가 일어날 확률만 아는데, , B가 일어날 확률을 구하는 것이 베이즈 정리의 목표이다. 다음과 같이, 조건부 확률 형태로 얻을 수 있다. 작동 원리 기본적으로, 나이브 베이즈는 feature끼리는 서로 독립이어야 한다. 독립을 가정하게 되면 좋은 점은, 여러 특성들을 가졌을때, 그 확률의 .. 2022. 8. 5.
[TIL] 0729 아침스터디 - Kernel Trick 들어가기 분류 문제에서, 선형 분류로 풀 수 없는 상황이 여럿 존재할 것이다. 이를 해결 할 수 있는 방법 중 하나가 Kernel Trick이다. 다음과 같이, 일차원 상에, 데이터가 놓여있다고 하자, 초록색 데이터와 파란색 데이터는 선분 하나만으로는 구분할 수 없다. 하지만, 여기에 차원을 추가하면 어떻게 될까? 즉 x -> {x, x^2} 으로 보내는 mapping을 고려하자. 2차원으로 보낸 순간, 빨간 구분선을 기준으로, 초록색 데이터와 파란색 데이터의 구분이 가능해졌다. 이렇게 쉬운 상황만 고려하면, 좋을텐데, 문제는 일반적으로는 mapping 이 되는 함수를 찾기가 매우 어렵다는 것이다. Kernel이란? Kernel 이란, mapping 이후에도 "내적"의 값을 유지시켜주는 함수를 의미힌다... 2022. 7. 29.