본문 바로가기
DS

[2021-객-5] adaboost vs gradient boosting

by okso6441 2023. 1. 28.

공통점: 부스팅, sequential(먼저 생성된 모델의 예측값이 다음 모델 생성에 영향)

 

차이점:

1) Weak learner: Stumps VS A leaf & Restricted trees

- stump (한 개 노드와 두 개의 가지를 갖는 매우 작은 decision tree) 를 사용

- restricted tree란, maximum number of leaves로 성장에 제한을 둔 decision tree

  ㄴ Gradient Boosting의 첫 번째 weak learner는 모든 샘플의 output 평균을 값으로 갖는 하나의 leaf

 

2) Predicted value: Output VS Pseudo-residual

 - AdaBoost에서는 각 stump들은 모두 실제 output 값을 예측하는 모델

  ㄴ따라서 이 값을 평균내거나 가중치를 곱한 평균을 통해, 실제 값에 가까운 예측값을 만들어냅니다.

 

- Gradient Boosting에서 각 restricted tree들이 예측하는 값은 실제 output과 이전 모델의 예측치 사이의 오차 
  ㄴ 최종 예측 시에는 각 모델의 오차를 scaling 후, 합하는 과정을 통해 실제 값에 가까운 예측값을 만들어냅니다.


3) Model weight: Different model weights (amount of say) VS Equal model weight (learning rate)

- G B: 동일한 learning rate 

 

https://tyami.github.io/machine%20learning/ensemble-4-boosting-gradient-boosting-regression/

'DS' 카테고리의 다른 글

ing [2021-객-12]  (0) 2023.02.03
[2021-객-9] 트리 개수와 결과 분산/편차 관계  (0) 2023.02.01
[2021-객-7] Loss vs Accuracy  (0) 2023.01.29
[2021-객-4] 포아송 회귀  (0) 2023.01.28
[2021-객-4] OLS Result 해석  (0) 2023.01.28