본문 바로가기

Archive171

[TIL] 0704 아침스터디 / VIF, LDA # VIF 다중공산성을 진단할 수 있는 지표. 다중공산성 : 회귀문제에서 독립변수간, 강한 상관관계가 나타나는 문제 (회귀분석의 기본 가정에 위배!) * 다중 공산성이 강하게 나타날 경우 여러 변수들 중 어떤 변수가 Y변수에 어느정도의 영향을 미치는지 정확하게 알 수 없어짐. * 다중공산성의 판단법? 회귀분석 결과의 각 독립변수의 p-val이 높다면? 의심. 독립변수들간의 상관관계를 통해 확인 가능, VIF를 통해 다중공산성 점검 가능. VIF란 ? i번째 변수를 제외하고, 만든 회귀 모델의 R^2값을 대입하여 계산한다. VIF > 10이라면, 식을 정리해보면 Ri > 10임을 알 수 있다. 즉 해당 변수가 없어도 설명이 잘 이루어지고 있음을 안다. 보통, VIF > 10일 경우, 해당 변수의 제외를 고.. 2022. 7. 4.
[Data] 대리분석 개요 출처 : XAI 설명 가능한 인공지능, 인공지능을 해부하다. Chapter 5-1,2 대리분석이란? 대리분석이란, 본래의 인공지능 모델이 너무 복잡해서 분석이 어려울 때, 유사한 기능을 흉내내는 모델 여러개를 만들어 본래 모델을 해석하는 기법을 말한다. 이 대리분석에 사용할 모델을 결정할 조건은 다음과 같다. (1) 원래의 모델보다 학습하기 쉬워야 한다. (2) 대리분석에 사용할 모델은 "설명 가능"해야 한다. (3) 원래의 모델을 유사하게 흉내낼 수 있으면 된다. 이렇게 할 경우, 대리분석의 모델은 원래 모델보다는 정확도는 조금 떨어지나, 충분히 모델을 대변할 수 있다. 이러한 대리 분석의 종류는 - 글로벌 대리 분석 : 전체 학습 데이터를 사용해 대리 분석 모델을 만든다. - 로컬 대리 분석 : 데이.. 2022. 6. 9.
[TIL] Transformer 간단정리. 풀잎스쿨 9주차 대비. 참고자료 [1] https://wikidocs.net/31379 [2] https://wdprogrammer.tistory.com/72 개요. * transformer는 2017년 구글이 발표한 논문 'Attention is all you need'에서 나온 모델. 기존의 seq2seq 구조인 encoder-decoder에서 각 encoder, decoder를 attention으로 제작. seq2seq -> attention을 사용했던 이유는 인코더가 입력 seq를 하나의 벡터로 압축하면서 정보가 날라가는 단점을 보정하기 위해 사용했는데, attention만으로 encoder와 decoder를 만들어 보면 어떻게 될지, 그리고 이렇게 한 것이 transformer이다. 기본적으로 .. 2022. 6. 8.
[NLP] seq2seq / attention 간단개념 * 풀잎스쿨 7주차 대비. 참고자료 [1] https://www.youtube.com/watch?v=0lgWzluKq1k [2] https://wikidocs.net/24996 seq2seq란? seq2seq는 encoder와 decoder로 구성되어있음. 즉 정보를 압축하고, 이를 어떻게 표현할지에 대해 표현하는 모델 encoder : 입력 문장를 순차적으로 받아서 하나의 벡터로 (context vector) 만들기 decoder : context vector를 바탕으로 해석, 한 개의 단어씩 순차적으로 뱉는다. (softmax 활용 최종 출력 단어 결정) * encoder와 decoder 각각은 RNN/LSTM으로 구성됨. (물론 성능 문제로 실제로는 LSTM / GRU로 구성) * encoder의 .. 2022. 5. 25.
[TIL] LSTM vs GRU 간단하게 정리. 풀잎스쿨 6주차 대비. * LSTM - RNN의 장기 의존성(Long-Term Dependency) 문제를 해결하기 위해 제안. LSTM도, RNN처럼 체인처럼 연결된 형태를 가지고 있음. (1) 입력 게이트 : 현재 정보를 기억하기 위한 게이트 (2) 출력 게이트 : 최종 결과를 내보내기 위한 게이트 (3) 망각 게이트 : 과거 정보를 기억하기 위한 게이트 / 0~1 수로 얼마나 과거 정보를 유지할지를 결정함. * GRU LSTM의 장기 의존성에 대한 문제 해결책은 유지하며, 계산량을 줄인 버전. (1) Reset Gate : 이전 hidden state의 값을 얼마나 활용할 것인가에 대한 정보. (2) Update Gate : 이전 정보와 현재 정보를 어떻게 받아들일지 비율을 구하는 계산. 2022. 5. 19.
[TIL] LTV란?, LTV의 예측 * 간단하게 읽어 본 내용들에 대한 정리. https://danbi-ncsoft.github.io/works/2020/03/16/works-mobile_mkt_ltv.html https://sungmooncho.com/2011/11/21/customer-lifetime-value/ https://eat-toast.tistory.com/18 LVT란? LTV : Life Time Value로, 특정 서비스를 이용하는 고객이 그 기간 동안 얼마만큼의 이익을 가져다 줄 것인지에 대해 추정하는 것을 말한다. LTV를 간단하게 생각하면, LTV= (고객이 가져다 줄 이익의 총합) - (고객의 유치 및 유지에 드는 비용) 이를 조금 더 쪼개서 생각해 볼 수 있다. 이익 요소 - 최초 1년 동안의 이익, 그 다음 해.. 2022. 5. 7.