1. 층화 표본 추출이란?
층화 표본 추출은 모집단을 서로 겹치지 않는 그룹들, 즉 층들로 나누고 각 층으로부터 표본을 단순확률추출법으로 뽑는 방법입니다. 이 때 얻어진 표본을 층화확률표본이라고 합니다. 주어진 비용 하에서 정보의 양을 증가시켜주는 추출법입니다.
이 방법은 모집단의 특성에 따라 층화하여 추출하면 표본의 분산을 줄일 수 있어서 추정량의 정확도를 높일 수 있습니다.
예를 들어, 대학에서 학생들을 대상으로 여론조사를 할 경우, 학생들을 학년이나 거주지별로 층화 조사하는 것이 효율적입니다.
2. 예시
학교에서 학생들의 성적을 조사하는 경우가 있습니다. 이 경우 학생들은 성적에 따라 여러 그룹으로 나눌 수 있습니다.
예를 들어, A그룹은 90 - 100점을 받은 학생들, B 그룹은 80 - 89점을 받은 학생들, C그룹은 70 - 79점을 받은 학생들입니다. 이 경우 각 그룹에서 일부 학생들을 무작위로 선택하여 표본을 추출합니다. 이렇게 하면 모집단의 각 부분 집합에서 적절한 수의 표본이 추출되므로 추정치가 개선됩니다.
3. 층화표본추출(Stratified sampling) VS 군집표본추출(Cluster sampling)
두 방법은 모집단에서 표본을 추출하는데 사용되는 두 가지 일반적인 방법입니다.
주요 차이점은 군집표본추출에서는 모집단을 구분하는 자연 그룹이 있지만 층화표본추출에선 이미 계층이라고 알려진 개별 그룹이 있을 수 있다는 것입니다. 층화표본추출에서는 이미 존재하는 그룹 내에 각 그룹의 존재 여부를 고려하여 추정치를 개선하기 위한해 방법을 조정합니다. 군집표본추출은 내재적으로 오차율이 높습니다.
층화표본추출은 모집단의 각 부분 집합에서 적절한 수의 표본이 추출되므로 추정치가 개선됩니다.
군집표본추출은 모집단의 일부분만 조사하므로 추정치가 정확하지 않을 수 있습니다.
4. VS 단순 무작위 추출법 (simple random sampling)
단순 무작위 추출법은 모잡단에서 무작위로 표본을 추출하는 방법입니다.
이 방법은 모집단의 모든 개체가 동일한 확률로 선택되므로 추정치가 정확합니다.
따라서 어떤 방법이 더 좋은지는 연구 목적과 조사 대상에 따라 다릅니다. 이에 대해서는 더 많은 정보가 필요합니다.
5. 단어
- 층화확률표본 (Stratified random sample)
모집단을 서로 겹치지 않는 그룹들, 즉 층들로 나누고 각 층으로부터 표본을 단순확률추출법으로 뽑는 방법입니다.
- 모집단 (population)
모집단이란 정보를 얻고자 하는 관심 대상의 전체 집합을 말합니다.
- 표본 (sample)
표본은 모집단의 일부분으로 모집단에서 무작위로 추출된 집합입니다.
- 추정치
추정치는 확률 표본의 특정한 관측값에 대한 추정량의 관측값으로, 추정량에 실제 관측값을 대입하여 나온 값을 의미합니다. 추정량은 모집단의 모수에 대한 추정으로 항상 표본 통계량이라는 정보로 이루어지며 실제의 관찰값을 넣어 계산한 값을 추정치라고 합니다.
- 오차율
오차율은 측정값과 이론값의 차이를 이론값으로 나눈 값에 100을 곱한 것입니다. 측정값과 이론값의 차이가 클수록 오차는 높아집니다.
'Python > Study' 카테고리의 다른 글
[Python / Study] 단순확률추출 (simple random sampling) (0) | 2023.04.20 |
---|---|
[Python / Study] 지도학습과 비지도학습 (0) | 2023.04.20 |
[Python / Study] 데이터 전처리 연습하기 (0) | 2023.04.19 |
[Python / Study] plotly 사용하여 시각화 연습 (3) (0) | 2023.04.17 |
[Python / Study] plotly 사용하여 시각화 연습 (2) (1) | 2023.04.17 |