1. 결정트리의 장점
- 이해와 해석이 쉬움 : 예/아니오 질문을 이어가며 데이터를 분류하기 때문에 구조가 직관적이고 시각화가 쉬워서 데이터의 흐름을 쉽게 이해할 수 있음.
- 구현과 전처리가 간단 : 복잡한 수식이나 데이터 전처리 없이도 규칙만 정하면 바로 적용 가능하고 범주형/수치형 데이터 모두 적용 가능.
- 특성 중요도 파악이 가능함 : 트리의 상위에 위치한 특성일수록 예측에 더 큰 영향을 주므로 특성 중요성 파악이 용이함.
2. 결정트리의 단점
- 과적합(Overfitting)에 취약 : 트리가 너무 깊어지면 학습 데이터에만 특화되어 실제 데이터에서는 성능이 떨어질 수 있다.
- 데이터 불균형 및 연속형 변수에 취약 : 한 쪽 클래스가 많은 불균형 데이터나 연속형(수치형) 변수가 많을 때는 성능이 저하될 수 있음.
- 예측 정확도가 낮을 수 있음 : 다른 복잡한 모델(신경망, 앙상블)에 비해 많은 경우 예측 정확도가 낮아짐. 특히 복잡하거나 노이즈가 많을 때 단일 결정트리는 성능이 떨어짐.
따라서, 결정트리는 쉽고 직관적이어서 설명이 필요한 상황에 적합하지만, 과적합과 데이터 특성에 따라 성능이 저하될 수 있으므로 실제 예측 정확도가 중요한 경우에는 다른 알고리즘과 함께 사용하거나 사전에 가지치기 등으로 복잡도를 조절하는 것이 필요함.

'컴퓨터' 카테고리의 다른 글
| 차원 축소 기법인 주성분 분석과 요인 분석의 차이는 무엇인가 (1) | 2025.05.31 |
|---|---|
| 부스팅은 어떤 특징을 가진 앙상블 기법인가. 토픽에서 배운 AdaBoost 이외의 부스팅 모델에는 무엇이 있는 지 각 부스팅 모델의 특징, 장단점에 대해 정리 (1) | 2025.05.31 |
| K-폴드 교차 검증에서 K의 값을 선택할 때 고려해야 할 점은 무엇인가 (0) | 2025.05.25 |
| 모델 학습 시 발생할 수 있는 편향과 분산에 대해 설명하고, 두 개념의 관계에 대해 설명 (0) | 2025.05.25 |
| 손실 함수(loss function)란 무엇이며 왜 중요한가 (0) | 2025.05.25 |