본문 바로가기

컴퓨터

결정 트리의 장점과 단점은 무엇인가

1. 결정트리의 장점

  • 이해와 해석이 쉬움 : 예/아니오 질문을 이어가며 데이터를 분류하기 때문에 구조가 직관적이고 시각화가 쉬워서 데이터의 흐름을 쉽게 이해할 수 있음.
  • 구현과 전처리가 간단 : 복잡한 수식이나 데이터 전처리 없이도 규칙만 정하면 바로 적용 가능하고 범주형/수치형 데이터 모두 적용 가능.
  • 특성 중요도 파악이 가능함 : 트리의 상위에 위치한 특성일수록 예측에 더 큰 영향을 주므로 특성 중요성 파악이 용이함.

2. 결정트리의 단점

  • 과적합(Overfitting)에 취약 : 트리가 너무 깊어지면 학습 데이터에만 특화되어 실제 데이터에서는 성능이 떨어질 수 있다. 
  • 데이터 불균형 및 연속형 변수에 취약 : 한 쪽 클래스가 많은 불균형 데이터나 연속형(수치형) 변수가 많을 때는 성능이 저하될 수 있음.
  • 예측 정확도가 낮을 수 있음 : 다른 복잡한 모델(신경망, 앙상블)에 비해 많은 경우 예측 정확도가 낮아짐. 특히 복잡하거나 노이즈가 많을 때 단일 결정트리는 성능이 떨어짐.

따라서, 결정트리는 쉽고 직관적이어서 설명이 필요한 상황에 적합하지만, 과적합과 데이터 특성에 따라 성능이 저하될 수 있으므로 실제 예측 정확도가 중요한 경우에는 다른 알고리즘과 함께 사용하거나 사전에 가지치기 등으로 복잡도를 조절하는 것이 필요함.

 

 


expand_less