Topics277 [TIL] 220119 O 면접 후기 오늘 면접 후기 - 분석가로 이력서엔 적혀있다... 왜 엔지니어? 라는 질문을 받았다. 사실 스스로는 진지하게 특히 최근에 방향성에 대해 방황중이다. 뭔가 실제 만들고 적용하는게 더 잘맞았다라고 대답은 했지만, 좋은 답변인진 모르겠다. 아무튼, 그래도 솔직하게 답은 했다. - 라이브 코딩테스트에서 왜 heap을 못떠올렸을까. 정확히는 너무늦게 떠올랐다. heap으로 풀면 아주 좋은 문제였던걸 너무 헤맨거 같다.... 아쉽다. 그래도 힙 대답을 마지막에 했다. 다행이다. - 정렬 알고리즘에 대해서 좀 더 정확히 찾아보고, 시간복잡도 부분을 정확하게 공부해보자. - 추가/ 로지스틱 회귀분석에서 왜 시그모이드 함수를 쓸가에 대해 좋은 답을 하지 못하였다.... 선형식으로 분석을 할 경우 이상치에 영향을 받고 .. 2022. 1. 19. [프로그래머스] Lv 2 2개 이하로 다른 비트 문제 풀이 링크 https://programmers.co.kr/learn/courses/30/lessons/77885 문제 설명 주어진 수보다 큰 수들 중 다음 조건을 만족하는 가장 작은 수 찾기 조건 : 2진법으로 바꿨을 때 1~2자리만 차이가 날 것. 풀이 방법 몇 가지 실험을 해보자. 1) 4의 경우, 100 -> 101 뒤의 자리만 바꾸면 된다. 맨 끝이 0이면 1을 하면 된다. 2) 5의 경우, 101 -> 2의 자리의 0을 바꾸고 일의 자리를 줄일 수 있다. 110 3) 11의 경우, 1011 -> 4의 자리를 1로 바꾸고, 그 다음에 2의 자리를 바꾸면 2개 차이가 나고, 가장 숫자 증감을 막았다. 4) 15의 경우, 1111-> 이것의 경우는 16의 자리를 1로 만들고, 증가를 가장 줄일려.. 2022. 1. 19. [TIL] 220118 면접 오답노트 정리 - 표본오차 (sampling error) : 모집단 전체에 대해서 측정을 할 수 없을때 표본을 뽑아서 데이터를 측정하는데, 이에 의해 생긴 오차를 표본오차라고 한다. - 신뢰도 : 기본적으로 신뢰도는 표본 평균이, 모평균으로부터 표준 오차 범위 내에 들어갈 가능성을 의미한다. 그런데 모평균을 모른다. 따라서, 이를 관점을 바꿔서 해석하면, 표번 평균으로부터 표준오차 이내의 구간에 모평균이 들어갈 확률을 신뢰도라고 생각하면 된다. - 카이제곱 검정 다시 이해하기 뭔가, 분포에 대해서 이해를 제대로 하지 못하고 있는 느낌이다. 서비스의 개선이 이루어졌는지, 실제 이어졌는지 확인을 위해서 '동질성 검정'을 실시할 수 있을 것이다... 동질성 검정은 기본적으로 두 개 이상의 범주형 자료가 동일한 분포를 갖는 .. 2022. 1. 18. [TIL] Y 1차 면접 후기 1차 면접 보고 왔다. 탈탈 털렸다! 하지만 그만큼 생각도 많이 하게 되었고 공부한 것을 돌아볼 수 있었다. 당분간은, 다른 것 보다는 통계학을 다지는데 집중해야 할 것 같다. 생각보다 통계 질문에서 많이 무너지고, 잘 전달을 하지 못한 것 같다. 그리고 그 부분에 대해서도 피드백을 받을 수 있었다. 통계 지식을 명백하게 하고, 이를 다지는데에 집중하자..! 2022. 1. 18. [Rec] Alternating Least Square와 Implicit Data를 활용한 추천 참고 [1] https://sungkee-book.tistory.com/13 [2] Paper - Collaborative Filtering for Implicit Feedback Datasets (Yifan Hu,, Yehuda Koren, Chris Volinsky) Implicit Data의 특성 파악하기 Implicit Data란, 추천 시스템에서 얻을 수 있는 평점 정보와는 다른 특성을 가지고 있다. 평점 정보는 1~5점 등으로 유저의 명백한 아이템에 대한 선호도를 보여주고 있다면, Implicit Data는 클릭 이력 등의 로그를 기반으로 학 있기에 다른 특성을 가지고 있다. - Negative한 feedback은 없다. - data에 noise가 많다. 즉 사용자가 이 아이템에 대해 선호도가.. 2022. 1. 17. [Networkx] 다음 검색어 네트워크 분석 Network 사용법도 익힐겸, 크롤링도 다시 복습해 볼 겸 다음의 문제를 해결해 보려고 했다. [ 해결 문제 ] 다음 검색에서 '코로나'를 검색하면 연관 검색어가 나온다. 그 연관검색어를 다시 검색창에 입력하면 또 연관 검색어가 나올 것이다. 이렇게 3단으로 만들어진 검색어 라인을 한 줄로 만들어 데이터를 수집하고, 이들에 대한 관계를 시각화로 표현하자. Step 1. Daum 검색어 크롤링 # 연관어 분석을 위한 크롤링을 실시한다. import bs4 import pandas as pd import numpy as np import re import requests from bs4 import BeautifulSoup word = '코로나' url_based = 'https://search.daum... 2022. 1. 6. 이전 1 ··· 20 21 22 23 24 25 26 ··· 47 다음