Archive171 [Java] 자바 기초 정리 1 - 기초 문법, 자료형 등. 모종의 일로. 자바를 좀 공부해보려고 한다. 오늘은 간단하게 문법들을 모두 정리하는 정도로.이미 정처기 따면서 class 이론은 공부했지만 실전은 차근차근.아, 물론 코테는 파이썬 할거다. 코테는 닥 파이썬.파이썬 > 자바 전환에 빠르게 적응해보려고 한다.(사실 둘 다 할줄 알아야 하지만.)package java_grammer_basic_practice;import java.util.ArrayList;import java.util.Arrays;import java.util.Comparator;import java.util.HashMap;import java.util.HashSet;public class example { public static void main(String[] args) { Strin.. 2024. 10. 16. [Data] Multi-Armed Bandit - 개념편 다음 글을 기반으로 정리하였습니다. - https://playinpap.github.io/mab/#mab%EA%B0%80-%EC%99%9C-%EB%98%91%EB%98%91%ED%95%9C%EA%B0%80 - https://hardenkim.tistory.com/181 - https://yjjo.tistory.com/38 - https://soobarkbar.tistory.com/135 들어가기 현업에서 데이터 분석을 하다보면, A/B 테스트는 피할 수 없습니다. 하지만 테스트는 공짜가 아니죠. 그리고 여러 딜레마적인 상황도 발생합니다. 이를 정리하면 다음과 같습니다. - A/B 테스트를 진행할수록, 기회 비용이 발생한다. - 하지만 그렇다고 A/B 테스트를 짧게 하면 신뢰성에 문제가 생긴다. - 결정적.. 2024. 4. 11. [Data] 결측치 처리 관련 (1) 6장 관련 내용입니다. 들어가기 데이터 분석을 하다보면, 결측치는 피할 수 없습니다. 결측치를 처리할 때 무지성으로 평균값을 넣던가, 최빈값을 넣던가 혹은 결측치의 양이 매우 적다면 무시하고 지우는 것도 방법일 것입니다. 그러나 결측치를 생각 없이 처리하면 문제가 발생할 수 있습니다. 생각없이 결측치를 처리한다면? 금융 결제와 관련된 데이터를 처리한다고 하겠습니다. 어플 사용과 관련된 데이터가 있다고 가정합시다. 어플 사용 내역이 없을 경우, 당연히 해당 데이터는 결측치로 들어갈 것입니다. 이 데이터가 없는 행을 모두 삭제하면 어떻게 될까요? 그렇게 될 경우 해당 데이터는 젊은 고객을 중심으로 편향될 것이기에 전체 고객을 대표한다고 함부로 말하기 어려울 것입니다. 즉, 편향된 데.. 2024. 4. 10. [Playground] 이직 예측 모델 만들기 (2) 1편 : https://taksw222.tistory.com/248 도입 2편의 목적은, 앞에서 만든 모델을 해석해 보는 것입니다. 물론 LightGBM을 Tree로 그릴 수 있겠지만, 조금 더 좋은 설명 명법은 없을까요? 우리는 인공지능에게 설명을 요구해보겠습니다. * 수정사항 : 1편과 다르게 2편에서는 경력 년수를 연수 자체로 변형하여 넣었습니다. XAI를 도입하자. 인공지능에게 설명을 요구하겠습니다. XAI는 간단하게, 모델이 왜 그런 결과를 내었는지 그 근거를 답해주는 역할을 말합니다. 간단하게 Ensemble Tree들의 Feature Importance도 하나의 예시가 될 수 있습니다. 하지만 더 중요한 질문을 하나 해보죠 그 변수가 중요한 판단의 기준인 건 알겠어요. 근데 그 값이 커지면 .. 2024. 2. 16. [Playground] 이직 예측 모델 만들기 (1) https://github.com/swtaktak/playground/blob/main/data_scientist_drop_predict/ds_move_predict.ipynb 도입 이 문제를 생각하게 된 계기는 이전에 원티드 채용공고 크롤링을 통해 직접 키워드를 분석해 본 적이 있었던 경험에서 기반하였다. 회사가 어떤 사람을 뽑고 싶어할지 공고의 주요 키워드를 보는 일이었다. 그러면, 이제 enter는 봤으니, "exit"를 보면 어떨지 고려해봅시다. 문제 목표 , 데이터 확인 https://www.kaggle.com/datasets/arashnic/hr-analytics-job-change-of-data-scientists (1) 이직에 대해 고려하고 있는 사람을 예측하기 (2) 클러스터링을 통한 인.. 2024. 2. 14. [Playground] 너의 레이팅이 보여 (2) 레이팅 예측에 도 전 1편 : https://taksw222.tistory.com/235 지난번 1편에서는 간단한 EDA 등을 진행하였습니다. 이번에는 그러면 예측 시도를 하겠습니다. 문제의 간략화 및 정확한 정의 우선 1:1 대결에서 두 플레이어간의 실력차가 클 경우 상수, 하수의 플레이 패턴이 달라질 것입니다. 따라서 레이팅 격차가 큰 경기들에 대해서는 정확한 예측을 방해할 수도 있어서 데이터에서 제외하겠습니다. 다음, chess.com에서는 모드별, 시간제한에 따라서 레이팅이 모두 다르게 산출됩니다. 즉 여러 시간 모드가 혼재되어 있으면 정확한 등급을 산정하기 어려울 것입니다. 또한 제한시간이 다르다면 당연히 고민의 깊이도 달라질 것이기에 정확한 등급 산출에 어려움이 있을 것입니다. https://www.youtube... 2024. 2. 2. 이전 1 2 3 4 ··· 29 다음