랜포 트리 개수(n_estimators) 늘린다
> 부트스트랩을 통한 한번의 선택에 대한 포함 데이터 수 작아진다 > 작아진 데이터로 트리를 구성한다 > 트리가 상대적으로 단순해진다 > 예측 결과 분포도 단순해진다(분산/편차가 작아진다)
> 더 다양한 샘플링을 통한 더 많은 weak learner 나무가 만들어진다 > 오버피팅 가능성이 적어진다
'DS' 카테고리의 다른 글
| [2022-객-1] 결측치와 확률밀도함수 (0) | 2023.02.04 |
|---|---|
| ing [2021-객-12] (0) | 2023.02.03 |
| [2021-객-7] Loss vs Accuracy (0) | 2023.01.29 |
| [2021-객-5] adaboost vs gradient boosting (0) | 2023.01.28 |
| [2021-객-4] 포아송 회귀 (0) | 2023.01.28 |