본문 바로가기

Playground4

[Playground] 이직 예측 모델 만들기 (2) 1편 : https://taksw222.tistory.com/248 도입 2편의 목적은, 앞에서 만든 모델을 해석해 보는 것입니다. 물론 LightGBM을 Tree로 그릴 수 있겠지만, 조금 더 좋은 설명 명법은 없을까요? 우리는 인공지능에게 설명을 요구해보겠습니다. * 수정사항 : 1편과 다르게 2편에서는 경력 년수를 연수 자체로 변형하여 넣었습니다. XAI를 도입하자. 인공지능에게 설명을 요구하겠습니다. XAI는 간단하게, 모델이 왜 그런 결과를 내었는지 그 근거를 답해주는 역할을 말합니다. 간단하게 Ensemble Tree들의 Feature Importance도 하나의 예시가 될 수 있습니다. 하지만 더 중요한 질문을 하나 해보죠 그 변수가 중요한 판단의 기준인 건 알겠어요. 근데 그 값이 커지면 .. 2024. 2. 16.
[Playground] 이직 예측 모델 만들기 (1) https://github.com/swtaktak/playground/blob/main/data_scientist_drop_predict/ds_move_predict.ipynb 도입 이 문제를 생각하게 된 계기는 이전에 원티드 채용공고 크롤링을 통해 직접 키워드를 분석해 본 적이 있었던 경험에서 기반하였다. 회사가 어떤 사람을 뽑고 싶어할지 공고의 주요 키워드를 보는 일이었다. 그러면, 이제 enter는 봤으니, "exit"를 보면 어떨지 고려해봅시다. 문제 목표 , 데이터 확인 https://www.kaggle.com/datasets/arashnic/hr-analytics-job-change-of-data-scientists (1) 이직에 대해 고려하고 있는 사람을 예측하기 (2) 클러스터링을 통한 인.. 2024. 2. 14.
[Playground] 너의 레이팅이 보여 (2) 레이팅 예측에 도 전 1편 : https://taksw222.tistory.com/235 지난번 1편에서는 간단한 EDA 등을 진행하였습니다. 이번에는 그러면 예측 시도를 하겠습니다. 문제의 간략화 및 정확한 정의 우선 1:1 대결에서 두 플레이어간의 실력차가 클 경우 상수, 하수의 플레이 패턴이 달라질 것입니다. 따라서 레이팅 격차가 큰 경기들에 대해서는 정확한 예측을 방해할 수도 있어서 데이터에서 제외하겠습니다. 다음, chess.com에서는 모드별, 시간제한에 따라서 레이팅이 모두 다르게 산출됩니다. 즉 여러 시간 모드가 혼재되어 있으면 정확한 등급을 산정하기 어려울 것입니다. 또한 제한시간이 다르다면 당연히 고민의 깊이도 달라질 것이기에 정확한 등급 산출에 어려움이 있을 것입니다. https://www.youtube... 2024. 2. 2.
[Playground] 너의 레이팅이 보여 (1) 도입, 데이터 탐색 Playground 시리즈는 프로젝트나 실패에 대한 부담 없이, 자유롭게 하고 싶은 데이터 분석을 해본 일지입니다. 상세 코드 : https://github.com/swtaktak/playground/blob/main/chess_play/chess_game_analysis.ipynb 도입 이번 Playground는 하나의 영상에서 시작됩니다. https://youtu.be/c7J4-t1-J0Y?si=lM_oqj3dEcoWslIQ 최근에 저는 체스를 배우기 시작했습니다. 아직 대인전을 해본 적은 없지만 쉬운 봇 몇 개 정도 도움 없이 이길 수 있는 정도의 실력입니다. 즉, 아직 체린이일 뿐이지만 새로운 취미로 즐기고 있습니다. 그런데, 굉장히 흥미로운 영상을 보았습니다. 경기만 보고, "두 플레이어의 평균.. 2024. 1. 26.