본문 바로가기

Archive/추천시스템8

[Rec] Alternating Least Square와 Implicit Data를 활용한 추천 참고 [1] https://sungkee-book.tistory.com/13 [2] Paper - Collaborative Filtering for Implicit Feedback Datasets (Yifan Hu,, Yehuda Koren, Chris Volinsky) Implicit Data의 특성 파악하기 Implicit Data란, 추천 시스템에서 얻을 수 있는 평점 정보와는 다른 특성을 가지고 있다. 평점 정보는 1~5점 등으로 유저의 명백한 아이템에 대한 선호도를 보여주고 있다면, Implicit Data는 클릭 이력 등의 로그를 기반으로 학 있기에 다른 특성을 가지고 있다. - Negative한 feedback은 없다. - data에 noise가 많다. 즉 사용자가 이 아이템에 대해 선호도가.. 2022. 1. 17.
[Rec] Learning to Rank 개념 * Learning to Rank가 대체 무엇인지 간단하게 알아보고자 한다. 추천 시스템의 목적으로 돌아가기 추천 시스템은 결국 사용자에게, 사용자가 좋아할만한 아이템을 추천해 주는 것이 목표이다. 추천 시스템의 문제 풀이 방향 2개를 복습하면 다음과 같다. 1) rating matrix 자체를 예측하는 것 2) rating 대신 top-k개를 예측하는 것 그런데 이전에 추천 시스템의 평가에 대한 내용을 상기해보면, 추천의 순서도 유의미할 것이다. 예를들어, top-5를 예측 후 사후에 확인해보니, 사용자가 top-5에 10점, 9점, 8점, 7점, 6점 순서로 5개에 평점을 매겼다. 그런데, 6점짜리를 가장 먼저 추천해줬다면? 아쉬운 결과일 것이다. Learning by Rank의 가장 궁극적인 목표는.. 2022. 1. 4.
[Rec] Factorization Machine이란? - 개괄잡기 관련 논문 : https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 이번에는, Factorization Machine이 무엇인지 정도, 간단하게 감을 잡아보고자 한다. (구체적인 코딩 및 학습 과정을 위해선..아직 논문을 깊게 읽어봐야 합니다...) 들어가기 전에 - Matrix Factorization 역시, 이번에도 시작점은 Matrix Factorization이다. Matrix Factorization의 주요 목적은 평점행렬을 user에 대한 부분과 item에 대한 부분으로 나누는 것이다. 여기서, 주요하게 겪을 수 있는 문제는 행렬을 분해하던, 근사를 하던(truncated SVD) rating matrix가 비어있을 경우 어떻게 채울 것인가? .. 2021. 12. 29.
[Rec] Neural Collaborative Filtering 리뷰(1) Neural Collaborative Filtering 리뷰 논문 : https://arxiv.org/abs/1708.05031 참고링크 : https://lsjsj92.tistory.com/613?category=792966 추천 시스템에 딥러닝, 신경망을 활용할 수 있을까? 해당 논문을 통해 어떤 구조로 만들었는지 우선 간단하게 파악하고 (2)편에서는 간단한 형태의 Matrix Factorizaion과 논문의 NCF 구현을 참고하여 두 모델의 비교를 진행하고자 한다. Introduction - NCF의 도입 이유, Matrix Factorization의 한계 inner product로는, latent feature을 linear하게 할 수 밖에 없을 뿐더러, latent factor를 활용할 경우 차.. 2021. 12. 26.
[추천] 추천 시스템의 평가 참고 [1] https://techblog-history-younghunjo1.tistory.com/133 [2] https://zzaebok.github.io/recommender_system/metrics/rec_metrics/ [3] https://jyoondev.tistory.com/131 복습 : 추천 시스템이 풀려는 문제 추천시스템은 크게 분류 문제 / 회귀 문제 관점 두 가지로 해석이 가능하다. - 분류 문제 : 유저가 좋아할만한 아이템을 k개 찾아 준다. - 회귀 문제 : 유저가 특정 아이템에 매길 평점을 예측한다. 이에 따라, 분류 문제와 회귀 무제에서 기존에 사용된 평가 지표를 활용 가능할 것이다? 기존 Metric의 문제점 하지만, 단순히 기존의 분류와 회귀에서 사용한 Metric을 .. 2021. 9. 15.
[추천] 추천 시스템과 Word2Vec 참고자료 [1] https://brunch.co.kr/@goodvc78/16 [2] https://eda-ai-lab.tistory.com/526 [3] https://wikidocs.net/102705 [4] https://www.sallys.space/blog/2018/05/18/Introduction-to-ReSys-part-2/ [ Word2Vec 복습 Word2Vec는, 문장 상에서 문맥을 통해 단어를 추측하는 방법이다. 이 때, 단어간 의미를 반영하는 벡터화를 활용 후 CBOW, 혹은 Skip-Gram을 활용한다. [복습] https://taksw222.tistory.com/100?category=475748 [밑딥2] 신경망에서의 단어 처리와 word2vec 목표 문장 상에서, 문맥을 통해 .. 2021. 8. 19.