1. EDA(Exploratory Data Analysis) : 탐색적 데이터 분석 이란, 데이터를 본격적으로 파고들기 전에 데이터의 생김새와 특징을 파악하기 위해 자류롭게 살펴보는 초기 단계 분석이다.
1) 분석하거나 모델링에 사용할 데이터가 실제로 어떤 모습이고 어떤 특징을 가지고 있으며 패턴이나 문제점은 없는지 탐색하고 파악하는 과정은 필수이다.
2) EDA는 데이터를 기본 통계치로 요약하고 다양한 그래프로 시각화하여 데이터의 분포, 변수 간 관계, 결측값, 이상치 등 주요 특징과 문제점을 식별함으로써 데이터에 대한 깊이 있는 이해를 제공한다.
3) 따라서 , 데이터의 특징을 파악하고 잠재적 문제를 미리 발견하여 분석 및 모델링 방향을 잡기 위한 핵심적인 초기 분석 단계이다.

'컴퓨터' 카테고리의 다른 글
| 모델 학습 시 발생할 수 있는 편향과 분산에 대해 설명하고, 두 개념의 관계에 대해 설명 (0) | 2025.05.25 |
|---|---|
| 손실 함수(loss function)란 무엇이며 왜 중요한가 (0) | 2025.05.25 |
| 지도 학습과 비지도 학습의 차이는 무엇인가 (0) | 2025.05.25 |
| 대표적인 데이터 전처리 방법인 결측값, 중복값, 이상치 처리에 대해 설명 (0) | 2025.05.18 |
| 선형대수학이란 어떤 학문이며, 왜 머신러닝(Machine Learning)에 필요한가 (0) | 2025.05.18 |