1. 분석 목적과 기본 원리의 차이
- 주성분 분석(PCA) : 데이터의 전체 분산을 최대한 보존하면서 상관관계가 있는 여러 변수를 상관관계가 없는 소수의 주성분(선형 결합)으로 변환해 차원을 축소하는 것이 목적임. 즉, 데이터의 변동성을 최대한 설명하는 새로운 축을 찾는 수학적 변환기법임.
- 요인 분석(FA) : 여러 관측 변수에 내재된 잠재적(숨겨진) 요인(factor)을 찾아 변수들 간의 상관관계를 설명하는 것이 목적임. 즉, 관측된 변수들이 실제로는 몇 개의 공통된 요인에 읠해 설명된다는 가정 하에 이 구조를 밝히는 통계적 모델링 기법임.
2. 분산 처리 방식과 결과 해석의 차이
- PCA는 데이터의 모든 분산(공통 분산 + 고유 분산)을 중요하게 여기며 주성분은 변수들의 단순한 선형 결합으로 산출됨. 주성분 자체는 해석적 의미가 약하고 데이터의 전체 변동성을 최대한 포착하는 것에 중점.
- FA는 변수들 사이의 공통 분산(공유된 변동성)만을 설명하는 것에 의미.
3. 적용 맥락과 실무적 활용의 차이
- PCA는 데이터의 구조적 가정 없이 변수 간의 상관관계를 줄여 단순화가 필요할 때 효과적임. 변수의 수가 많아 분석이 복잡할 때 핵심 정보만 남기는 것에 적합.
- FA는 변수들에 내재된 이론적 구조(잠재 요인)를 밝히고자 할 때 적합함. 심리학, 사회과학 등에서 관측 불가능한 특성을 여러 측정 지표로 추정할 때 활용.
따라서, PCA와 FA는 모두 차원 축소 기법이지만 목적, 분산 처리 방식, 해석 및 적용 맥락에서 분명한 차이가 존재함.

'컴퓨터' 카테고리의 다른 글
| 딥러닝의 성능향상을 위해 고려하는 하이퍼파라미터의 종류에는 어떤 것들이 있는지 설명 (0) | 2025.06.08 |
|---|---|
| 딥러닝과 머신러닝 간의 포함관계에 대해 설명 (0) | 2025.06.08 |
| 부스팅은 어떤 특징을 가진 앙상블 기법인가. 토픽에서 배운 AdaBoost 이외의 부스팅 모델에는 무엇이 있는 지 각 부스팅 모델의 특징, 장단점에 대해 정리 (1) | 2025.05.31 |
| 결정 트리의 장점과 단점은 무엇인가 (0) | 2025.05.31 |
| K-폴드 교차 검증에서 K의 값을 선택할 때 고려해야 할 점은 무엇인가 (0) | 2025.05.25 |