자기 조직화 지도, SOM이란?
SOM은 비지도 신경망으로, 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 표현, 형상화하는 방법이다. SOM을 통해서 차원 축소와 군집화를 동시에 수행할 수 있게 된다.
고차원의 데이터에서 유사한 데이터들은 저차원에서는 서로 연결되게 된다. 즉 저차원에서의 유사도는, 원본 고차원 데이터에서 유사도가 최대한 보전이 되도록 학습시키는 것이 중요할 것이다.
SOM의 구조
SOM은 두개의 층으로 구성되어 있다.
- 입력층
입력 변수와 동일하게. 뉴런을 만든다. 이 때, 입력층에 있는 각각의 뉴런은 경쟁층에 있는 각각의 뉴런 모두와 연결되어 있다. (fully-connected)
- 경쟁층 : 2차원 격자로 구성된 층
입력 변수에 따라 벡터가 한 점으로 클러스터링이 일어나게 된다. 각각의 뉴런이 벡터와 얼마나 가까운가를 계산하여, 연결 강도를 재조정하게 된다.
SOM의 학습 과정 및 세부 모델
먼저, 기본적으로는
가중치 행렬의 초기화 -> 입력 벡터와 경쟁층 노드 간의 거리 계산 -> 거리 값이 적은 노드의 선택 -> 가중치 수정
의 과정을 거치게 된다.
가중치의 수정은
새 가중치 = 이전 가중치 + 학습률 * (현재 벡터 - 이전 가중치) 형태로 이루어진다.
SOM의 장단점 및 특징
SOM의 경우는 고차원 데이터를 2차원 형태로 표현하기에, 시각적인 이해가 쉬우나 연산의 복잡성이 있기에 복잡한 데이터의 경우 분석이 어려워진다.
'Archive > 데이터 분석 관련' 카테고리의 다른 글
[Data] Missing Value의 여러 대체 방법 (0) | 2022.02.23 |
---|---|
[Data] PCA의 주성분 개수 결정 방법 (0) | 2022.02.17 |
[Data] Bayesian AB Test (0) | 2022.02.09 |
[Data] A/B Test란? (0) | 2022.02.02 |
[Data] 그래프 중심성에 대해 이해하기 (0) | 2022.01.25 |