샘플링 기초에 대한 내용 정리하기 2
오늘도 어제에 이어서 공학도를 위한 통계학이라는 책 1장 샘플링 기초의 내용을 요약해서 정리해놓았습니다.
샘플링 방식
샘플링이라고 생각하면 정해진 수의 표본을 무작위로 추출하는 것으로 알고 있지만, 모집단을 소그룹으로 분류하여 그룹별 샘플링하는 경우가 더 흔합니다.
- 단순 랜덤 샘플링
- 모집단을 구성하는 각각의 개체를 표본으로 추출될 확률을 모두 같게 하는 독립적인 방식입니다. 단순 랜덤 샘플링으로 추출된 표본을 iid 표본이라고 합니다.
- 층화 샘플링
- 모집단을 공통의 특성을 갖는 그룹들로 분할하고 각 그룹에서 무작위로 추출하는 방식입니다.
- 집락 샘플링
- 무작위로 집락을 추출하고 대상 집락의 개체 모두를 표본으로 추출하는 방식입니다.
- 다단계 샘플링
- 여러 단계로 나누어 단계별로 무작위로 샘플링하는 방식입니다.
- 계통 샘플링
- 일정한 간격으로 표본을 추출하는 방식입니다.
- 지그재그 샘플링
- 위 계통 샘플링에서 치우침을 방지하기 위해서 상이한 간격으로 표본을 샘플링하는 방식입니다.
샘플링의 오차
랜덤 샘플링으로 추출한 표본을 확률표본이라고 하는데, 이를 이용하면 공정성을 보장할 수 있습니다.
확률 표본을 사용하더라도 항상 정확하게 반영할 수 없기 때문에 오차라는게 생기며 이를 통계량과 모수와의 차이라고 힙니다.
여기서 발생하는 오차에는 샘플링 오차와 샘플링외 오차가 있는데, 샘플링 오차란 모집단의 일부분만 사용해서 문제가 생긴 오차입니다.
샘플링외 오차는 샘플링과 관계없이 생기는 오차로서 주로 분석오차와 측정오차가 해당됩니다.
오차 분류
-
측정오차 : 측정계기의 부정확함에서 오는 오차
-
샘플링오차 : 치우진 샘플링으로 인한 오차
-
분석오차 : 표본을 분석하다 발생하는 오차
-
축분오차 : 큰 표본에서 표본을 얻을 때에 발생하는 오차
오차 검토
-
신뢰성 : 분포 형태가 단붕이며 대칭 형태인지 검토
-
정밀도 : 분산, 표준편차, 범위등을 검토
-
정확성 : 평균치와 모편균의 차이 검토
Written on September 1, 2018