본문 바로가기
Archive/데이터 분석 관련

[Data] 자기 조직화 지도 (Self-Organizing Map) 이란? - 개요잡기

by 다람이도토리 2022. 2. 13.

자기 조직화 지도, SOM이란?

SOM은 비지도 신경망으로, 고차원의 데이터를 이해하기 쉬운 저차원의 뉴런으로 정렬하여 지도의 형태로 표현, 형상화하는 방법이다. SOM을 통해서 차원 축소와 군집화를 동시에 수행할 수 있게 된다.

고차원의 데이터에서 유사한 데이터들은 저차원에서는 서로 연결되게 된다. 즉 저차원에서의 유사도는, 원본 고차원 데이터에서 유사도가 최대한 보전이 되도록 학습시키는 것이 중요할 것이다.

SOM의 구조

사진 출처 : https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=pmw9440&logNo=221588292503

SOM은 두개의 층으로 구성되어 있다.

- 입력층

입력 변수와 동일하게. 뉴런을 만든다. 이 때, 입력층에 있는 각각의 뉴런은 경쟁층에 있는 각각의 뉴런 모두와 연결되어 있다. (fully-connected)

- 경쟁층 : 2차원 격자로 구성된 층

입력 변수에 따라 벡터가 한 점으로 클러스터링이 일어나게 된다. 각각의 뉴런이 벡터와 얼마나 가까운가를 계산하여, 연결 강도를 재조정하게 된다.

SOM의 학습 과정 및 세부 모델

먼저, 기본적으로는

가중치 행렬의 초기화 -> 입력 벡터와 경쟁층 노드 간의 거리 계산 -> 거리 값이 적은 노드의 선택 -> 가중치 수정

의 과정을 거치게 된다.

가중치의 수정은 

새 가중치 = 이전 가중치 + 학습률 * (현재 벡터 - 이전 가중치) 형태로 이루어진다.

SOM의 장단점 및 특징

SOM의 경우는 고차원 데이터를 2차원 형태로 표현하기에, 시각적인 이해가 쉬우나 연산의 복잡성이 있기에 복잡한 데이터의 경우 분석이 어려워진다.