본문 바로가기
DS

[2021-객-9] 트리 개수와 결과 분산/편차 관계

by okso6441 2023. 2. 1.

랜포 트리 개수(n_estimators) 늘린다

> 부트스트랩을 통한 한번의 선택에 대한 포함 데이터 수 작아진다 > 작아진 데이터로 트리를 구성한다 > 트리가 상대적으로 단순해진다 > 예측 결과 분포도 단순해진다(분산/편차가 작아진다)

> 더 다양한 샘플링을 통한 더 많은 weak learner 나무가 만들어진다 > 오버피팅 가능성이 적어진다 

 

'DS' 카테고리의 다른 글

[2022-객-1] 결측치와 확률밀도함수  (0) 2023.02.04
ing [2021-객-12]  (0) 2023.02.03
[2021-객-7] Loss vs Accuracy  (0) 2023.01.29
[2021-객-5] adaboost vs gradient boosting  (0) 2023.01.28
[2021-객-4] 포아송 회귀  (0) 2023.01.28