본문 바로가기
DS/통계

데이터 샘플링

by okso6441 2023. 3. 1.

확률적 비확률적

 


1.1 단순임의표본추출(simple random sampling)

- 항아리에 N장의 번호가 적힌 카드를 넣고 그 중 중복을 허락하지 않고 n장의 카드를 한장씩 꺼내는 방법

- 장점: 조사자의 편견 개입 확률 없음. 모집단 사전 지식 필요 없음

- 단점: 조사자가 모집단에 대해 가진 지식 활용 불가능


1.2 계통추출법(systematic sampling)

- 최초의 표본 단위만 무작위 추출 후, 나머지 표본들은 일정한 간격(K)를 두고 표본 크기만큼 추출

- 장점: 표본 추출이 용이, 모집단을 잘 대표함

- 단점: 모집단의 배열이 일정한 주기성 or 경향성을 가질 때 대표성이 문제가 됨


1.3 층화표본추출(stratified random sampling)

- 모집단이 상호 이질적인 부 그룹들로 구성된 경우, 각 부 그룹에서 독립적으로 임의표본 추출하여 표본을 확보하는 방법

- 장점: 중요 집단 빼지 않고 표본에 포함. 보다 신뢰적인 모집단 추정 가능

- 단점: 부 그룹으로 층화 시 모집단에 대한 지식 필요

 


1.4 집략표본추출(cluster sampling)

- 모집단을 여러 개의 군집으로 형성한 후 단순임의표본 추출로 군집 추출

   > 표본으로 선정된 군집에 대해 그 구성단위 전수 조사 

- 장점: 선정된 군집에 대해서만 전수조사로 시간/비용 절약

- 단점: 단순임의표본 추출보다 특정집단의 특성이 과대/과소하게 나타날 위험성

 

 

'DS > 통계' 카테고리의 다른 글

데이터 리샘플링  (0) 2023.03.01
데이터 분할  (0) 2023.03.01
[2019-객-5] 음이항 분포(Negative Binomial distribution)  (0) 2023.02.26
IQR  (0) 2023.02.26
[2021-객-14] 베르누이 정규 감마 베타 지수 분포  (0) 2023.02.26