Skip to content

기계학습 비지도학습 Autoencoder #

Find similar titles

3회 업데이트 됨.

Edit
  • 최초 작성자
    ygkim
  • 최근 업데이트

Autoencoder #

Autoencoder란? #

Autoencoder는 비지도 학습(Unsupervised Learning)의 한 종류로, 입력 데이터의 효율적인 표현을 학습하는 신경망입니다. 기본적으로 입력 데이터를 압축하고 복원함으로써 데이터의 특징을 추출하고 잠재적인 패턴(Latent)을 학습합니다. 이는 데이터의 차원 축소, 잡음 제거, 특성 추출 등 다양한 영역에서 활용됩니다.

Image

<출처 : https://wegonnamakeit.tistory.com/73>

Autoencoder의 종류 #

Stacked Autoencoder #

가장 기본적인 구조인 input layer, hidden layer, output layer로 이루어진 형태로, 입력값을 내부 표현으로 압축하고 이를 복원하여 원래 입력값과 가깝게 만듭니다. 레이어를 추가하게 되면 Deep Autoencoder라고 부르며 오토인코더가 더 복잡한 패턴을 학습할 수 있습니다.

Denoising Autoencoder #

입력 데이터에서 hidden layer로 갈 때 잡음을 추가한 후, 원래 데이터를 복원하는 과정을 학습하여 잡음 제거 능력을 강화합니다. 노이즈를 추가함으로 성능향상의 효과를 얻을 수 있습니다.

Sparse Autoencoder #

기본적인 Autoencoder 구조와는 달리 hidden layer 내 Node 수가 더 많은 구조입니다. 입력 데이터의 희소한(representation이 0에 가까운 값이 많은) 표현을 학습하여 더 간결하고 중요한 특징을 추출하게 되며 Feature 압축 시의 overfitting 문제를 방지 할 수 있습니다.

Variational Autoencoder (VAE) #

확률적 잠재 변수를 활용하여 데이터의 확률적인 표현을 학습하는 데 중점을 둔 모델로, 확률 분포의 파라미터를 학습하여 데이터의 의미 있는 표현을 얻습니다. 잠재 공간에서의 샘플링을 통해 새로운 데이터 생성과 효율적인 데이터 특성 학습이 가능합니다.

활용 사례 #

차원 축소(Dimensionality Reduction): #

이미지, 텍스트, 음성 등 다양한 데이터에서 중요한 특징을 추출하여 차원을 축소하고 데이터를 시각화하거나 효율적으로 저장하는 데 사용됩니다.

잡음 제거(Noise Reduction): #

Denoising Autoencoder는 입력 데이터에 잡음을 추가하고 이를 제거하는 방식으로 데이터를 정제하는 데 사용됩니다.

특성 추출(Feature Extraction): #

데이터의 중요한 특징을 학습하여 새로운 표현을 만들어내는 데 활용됩니다. 예를 들어, 이미지에서 중요한 특징(모서리, 질감 등)을 추출하여 패턴 인식에 활용할 수 있습니다.

생성 모델(Generative Models): #

VAE와 같은 Autoencoder는 데이터의 분포를 학습하고, 이를 기반으로 새로운 데이터를 생성하는 데 사용됩니다. 이미지, 음성, 텍스트 등의 생성에 활용될 수 있습니다.

오믹스 데이터 실 활용 사례 #

아래 논문은 각기 다른 형태의 오믹스 데이터를 Variational Autoencoder 모델을 활용하여 데이터를 통합하고 잠재적인 특성을 추출, 학습하는 방법을 사용하였습니다. Image

<출처 : Integrated multi-omics analysis of ovarian cancer using variational autoencoders>

참고문헌 #

0.0.1_20240214_1_v81