도약하다

[신호 처리 분석] Independent Component Analysis (ICA) 본문

데이터 사이언스/Signal Processing

[신호 처리 분석] Independent Component Analysis (ICA)

doyak1223 2024. 3. 21. 22:30

Independent Component Analysis (ICA, 독립 성분 분석)은 여러가지 정보가 복잡하게 섞여있는 다차원의 신호나 데이터 세트를 가능한 한 독립적인 구성 요소로 분해하는 통계적 계산 방법이다. ICA의 발견과 개발은 신호처리 분야에 혁명적인 변화를 가져왔으며, 복잡한 데이터 세트에서 독립적인 신호 원천을 분리해내는 데 큰 역할을 하고 있다.


ICA의 발견과 배경

ICA는 1980년대 후반에 처음 개발되었는데, 특정한 한 사람에 의해 발견된 것이 아니라 여러 연구자들에 의해 점진적으로 개발되었고, 주로 이미지와 오디오 신호 처리 분야에서 사용되기 시작했다. ICA 분야에서 주목할 만한 기여를 한 인물로는 피에르 콤톤(Pierre Comon)이 있다. 콤톤은 1994년에 ICA에 대한 핵심적인 논문을 발표하여, 독립 성분 분석을 정식으로 소개하고 수학적 기반을 마련했고, 에이조 화이트(Aapo Hyvärinen), 어노 자비스코(Erkki Oja), 그리고 테우노 코호넨(Teuvo Kohonen)과 같은 핀란드의 연구자들은 ICA의 이론적 발전과 실용적 적용에 중요한 공헌을 했다. 특히 에이조 화이트는 ICA의 인기 있는 알고리즘 중 하나인 FastICA 알고리즘을 개발하는 데 중요한 역할을 했다.

 

ICA의 원리

위에서 언급했듯이, ICA는 데이터 세트를 구성하는 여러 독립적인 신호로 분해하는 방법이다. 예를 들어, 뇌파(EEG) 데이터에서는 뇌의 다양한 영역과 기능적 활동이 복합적으로 신호에 기여한다. ICA는 이러한 신호를 개별적인 원천으로 분리하여, 특정 뇌 영역이나 기능적 활동과 관련된 신호만을 추출할 수 있도록 한다. 이를 위한 ICA의 과정을 큰 맥락에서 정리 해보자.

  1. 데이터 준비: 분석에 앞서, 데이터를 정제해야한다. 지난시간에 간략하게 공부한 것처럼 filtering, sampling, normalization등을 통해 노이즈와 artifact를 제거하고, 데이터가 ICA 분석에 적합한 형태로 조정되는 과정을 거쳐야한다.
  2. 알고리즘 적용: ICA 알고리즘은 데이터 세트를 여러 독립적인 성분으로 분해한다. 이 과정에서 최적화 기법이 사용되어, 각 성분의 독립성이 최대화 된다.
  3. 성분 분석: 분리된 성분은 각각 분석되어, 특정 뇌 활동이나 신호 원천과의 관련성이 평가된다.

ICA를 분석하는 모습이다. 매우 복잡 해 보인다.


ICA의 수학적 표현

모델은 데이터의 선형 혼합 모델을 가정한다. 이 모델은 데이터가 독립적인 성분들의 선형 조합으로 구성되어 있다고 보는 것인데, 여기서 선형 조합이란 각 독립 성분이 특정 가중치로 곱해져 합쳐지는 것을 의미한다. 수학적 형태로는 일반적으로 다음과 같이 표현된다.

$$x=As$$

  • x - 관측된 데이터 벡터이다. 예를 들어, 다양한 전극으로부터 측정된 신호일 수 있다.
  • A - 알려지지 않은 혼합 행렬 (mixing matrix)로, 독립 성분들이 어떻게 혼합되었는지를 나타낸다.
  • s - 독립 성분 벡터로, 우리가 찾고자 하는 원래의 독립적인 신호 또는 데이터 성분들이다.

ICA의 목표는 관측된 데이터 x를 통해 혼합 행렬 A를 추정하고, 이를 사용해 독립 성분 s를 복원하는 것이다. 자세한 수행과정과 적용 방식은 앞으로 많은 실습을 통해 알아갈 것이다.


결론

ICA는 EEG 분석, fMRI 데이터 분석, 생물학적 신호 처리 등 다양한 분야에서 널리 사용된다. 예를 들어, EEG 데이터에서는 ICA가 눈 깜빡임이나 근육의 전기적 활동과 같은 artifact를 식별하고 제거하는 데 사용될 수 있다. 이를 통해 더 깨끗하고 정확한 뇌 활동의 신호를 얻을 수 있고 복잡한 신호를 더 깊이 이해할 수 있다. 다음 시간에는 신호를 시각화 하는 방법중 Topographical Mapping에 대해 살펴 볼 것이다.