본문 바로가기

컴퓨터

차원 축소 기법인 주성분 분석과 요인 분석의 차이는 무엇인가

1. 분석 목적과 기본 원리의 차이

  • 주성분 분석(PCA) : 데이터의 전체 분산을 최대한 보존하면서 상관관계가 있는 여러 변수를 상관관계가 없는 소수의 주성분(선형 결합)으로 변환해 차원을 축소하는 것이 목적임. 즉, 데이터의 변동성을 최대한 설명하는 새로운 축을 찾는 수학적 변환기법임.
  • 요인 분석(FA) : 여러 관측 변수에 내재된 잠재적(숨겨진) 요인(factor)을 찾아 변수들 간의 상관관계를 설명하는 것이 목적임. 즉, 관측된 변수들이 실제로는 몇 개의 공통된 요인에 읠해 설명된다는 가정 하에 이 구조를 밝히는 통계적 모델링 기법임.

2. 분산 처리 방식과 결과 해석의 차이

  • PCA는 데이터의 모든 분산(공통 분산 + 고유 분산)을 중요하게 여기며 주성분은 변수들의 단순한 선형 결합으로 산출됨. 주성분 자체는 해석적 의미가 약하고 데이터의 전체 변동성을 최대한 포착하는 것에 중점.
  • FA는 변수들 사이의 공통 분산(공유된 변동성)만을 설명하는 것에 의미. 

3. 적용 맥락과 실무적 활용의 차이

  • PCA는 데이터의 구조적 가정 없이 변수 간의 상관관계를 줄여 단순화가 필요할 때 효과적임. 변수의 수가 많아 분석이 복잡할 때 핵심 정보만 남기는 것에 적합. 
  • FA는 변수들에 내재된 이론적 구조(잠재 요인)를 밝히고자 할 때 적합함. 심리학, 사회과학 등에서 관측 불가능한 특성을 여러 측정 지표로 추정할 때 활용.

따라서, PCA와 FA는 모두 차원 축소 기법이지만 목적, 분산 처리 방식, 해석 및 적용 맥락에서 분명한 차이가 존재함.

 

 


expand_less