1. 대응표본
대응표본이란 같은 대상에 대해 두 번의 측정을 한 후 두 측정치의 평균이 차이가 있는지 비교하는 통계적 방법입니다.
예를 들면 처치나 중재, 약물, 교육, 치료 등의 효과를 알아보기 위해 측정하기 전과 후의 체중, 머리카락 수, 점수, 통증 등을 비교하는 경우가 있습니다.
2. 대응표본 t 검정
대응표본 t 검정은 두 집단의 평균 차이를 검정하는 방법 중 하나입니다. 대응표본 t 검정은 두 집단의 데이터가 서로 대응되는 경우에 사용합니다.
예를 들어 동일한 사람들의 전후 측정치를 비교할 때 사용합니다. 대응표본 t 검정은 두 집단의 차이가 정규분포를 따르는 경우에 사용할 수 있습니다.
3. 대응표본 t 검정은 언제 사용할까?
대응표본 t 검정은 두 개의 관측치가 서로 대응되는 경우에 사용합니다.
예를 들어, 동일한 사람들이 전후로 다른 시점에 측정된 경우입니다. 이 검정은 두 관측치의 차이가 통계적으로 유의미한지 여부를 결정합니다. 대응표본 t 검정은 두 관측치의 차이가 정규분포를 따르는 경우에 사용할 수 있습니다.
4. 대응표본 t 검정의 한계
대응표본 t 검정은 두 관측치가 서로 독립적이지 않은 경우에 사용합니다. 만약 두 관측치가 서로 독립적이라면 독립표본 t 검정을 사용해야 합니다.
대응표본 t 검정은 두 관측치의 차이가 크지 않은 경우엔 검정력이 낮아질 수 있습니다.
5. 대응표본 t 검정을 사용할 때 주의할 점
대응표본 t 검정은 대응되는 두 개의 표본을 비교하는 검정 방법입니다.
대응표본 t 검정을 사용하기 위해선 대응되는 두 개의 표본이 필요합니다.
대응표본 t 검정을 사용할 때는 두 개의 표본이 정규분포를 따르는지 확인해야합니다.
대응표본 t 검정을 사용할 때는 두 개의 표본이 등분산성을 가지는지 확인해야합니다.
대응표본 t 검정을 사용할 때는 유의수준을 적절하게 설정해야합니다.
6. 독립표본 t 검정
독립표본 t 검정은 두 개의 독립적인 표본 간에 평균값이 동일한 지를 검정합니다. 이 검정은 두 독립 표본이 평균이 같고 등분산이라고 가정합니다.
이 검정은 두 집단의 평균 차이가 유의미한지를 검증하는데 사용됩니다.
예를 들어 A와 B 두 그룹의 평균값이 같은지를 알고 싶을 때 사용할 수 있습니다.
만약 두 집단의 평균값이 같다면 이 검정은 종료됩니다. 하지만 만약 두 집단의 평균값이 다르다면, 이 검정은 계속됩니다.
7. 독립표본 t 검정 분산이 같은 경우와 다른 경우
독립표본 t 검정에서는 두 집단의 분산이 같은 경우와 다른 경우를 나우어 생각합니다. 이를 등분산 가정이라 합니다. 두 집단의 분산이 같은 경우에는 등분산 가정을 만족하므로 독립표본 t 검정을 수행할 수 있습니다. 반면에 두 집단의 분산이 같지 않은 경우에는 등분산 가정을 만족하지 않으므로 Welch's t-test를 수행합니다. Welch's t-test는 두 집단의 분산이 같지 않은 경우에도 유효한 검정 방법입니다.
8. 대응표본 t 검정과 독립표본 t 검정의 차이
대응표본 t 검정과 독립표본 t 검정은 둘 다 두 집단의 평균 차이를 검정하는 방법입니다. 하지만 독립표본 t 검정은 두 집단이 서로 독립적인 경우에 사용하고 대응표본 t 검정은 두 집단이 서로 관련성이 있는 경우에 사용합니다.
독립표본 t 검정은 두 집단의 평균 차이가 통계적으로 유의한지를 검증하는 방법입니다.
이 방법은 두 집단의 분산이 같은 경우와 같지 않은 경우로 나눌 수 있습니다.
대응표본 t 검정은 같은 모집단에서 추출된 두 집단의 평균 차이를 검증하는 방법입니다. 이 방법은 두 집단의 차이가 정규분포를 따르는 경우와 그렇지 않은 경우로 나룰 수 있습니다.
9. t 검정이란?
t 검정은 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정하는 방법입니다. 두 모집단의 평균 간의 차이가 없다는 귀무가설과 모 집단의 평균 간에 차이가 있다는 대립가설 중에 하나를 선택할 수 있도록 하는 통계적 검정방법입니다. t 검정의 판단준거가 되는 t 분포는 일반적으로 정상분포가 아니며, t 분포가 얼마나 정상분포에 접근하는냐는 자유도에 의해 결정됩니다.
10. 개념 공부
- 정규분포
정규분포는 평균과 표준편차를 이용하여 그래프로 나타낼 수 있는 분포입니다. 정규분포는 대칭적인 종 모양의 그래프를 가지며 평균값을 중심으로 좌우 대칭입니다.
정규분포의 특징은 다음과 같습니다.
1. 평균값이 중심이 되며, 표준편차가 작을수록 그래프가 뾰족해집니다.
2. 표준편차가 클수록 그래프가 완만해집니다.
3. 평균값에서부터 표준편차의 배수만큼 떨어진 지점에서 그래프가 급격하게 하강합니다.
정규분포는 자연계에서 매우 많이 나타나는 분포 중 하나입니다. 예를 들어, 인간의 키나 체중 등은 대부분 정규분포를 따릅니다.
- 등분산성 (homoscedasticity)
등분산성은 모둔 확률 변수가 같은 유한 분산을 가지는 성질을 가정하는 것입니다. 등분산성은 분산분석(ANOVA)을 통해 서로 다른 두 개 이상의 집단을 비교하고자 할 때, 기본적으로 해당 집단들이 등분산성을 가지고 있는지 검정합니다. 등분산성 검정은 t-test나 F-test를 포함한 많은 통계적 검정 기법에서 정규성과 함께 조건으로 하고 있습니다.
- 분산분석 (ANOVA)
분산분석은 통계학에서 두 개 이상의 집단을 비교하고자 할 때 집단 내의 분산, 총평균 그리고 각 집단의 평균의 차이에 의해 생긴 집단 간 분산의 비교를 통해 만들어진 F 분포를 이용하여 가설검정을 하는 방법입니다. 분산분석은 명목척도로 측정된 독립변수와 등간척도 또는 비율척도로 측정된 종속변수 사이의 관계를 연구하는 통계기법입니다.
- F-검정 (F-test)
F-검정은 분산분석(ANOVA)에서 사용되는 검정 방법 중 하나입니다. F-검정은 두 개 이상의 모집단에서 추출된 표본들의 분산이 같은지를 검정하는 방법입니다. F-검정은 분산분석에서 귀무가설이 "모든 모집단의 분산이 같다"는 것이고 대립가설은 "적어도 하나의 모집단의 분산이 다르다"는 것입니다.
F-검정은 ANOVA와 회귀분석에서 사용되며, ANOVA는 여러 개의 집단 간에 평균 차이가 있는지를 검정하는 방법이고 회귀분석은 독립변수와 종속변수 간의 관계를 분석하는 방법입니다.
- Welch's t-test
Welch's t-test는 두 집단의 평균 차이를 검정하는 방법 중 하나입니다. 두 집단의 분산이 같지 않을 때 사용합니다. 이 검정 방법은 Student's t-test와 비슷하지만 두 집단의 분산이 같지 않을 때 Student's t-test를 사용하면 오류가 발생할 수 있습니다.
Welch's t-test는 두 집단의 평균 차이가 유의미한지를 검정하는 방법입니다. 이 검정 방법은 두 집단의 크기가 다르거나 분산이 다른 경우에 사용할 수 있습니다.
- Student's t-test
Student's t-test는 두 집단의 평균 차이를 검정하는 방법 중 하나입니다. 이 검정 방법은 두 집단의 분산이 같을 때 사용합니다. Student's t-test는 두 집단의 평균 차이가 유의미한지를 검정하는 방법입니다. 두 집단의 크기가 다를 때도 사용할 수 있지만 이 경우 Welch's t-test를 사용하는 것이 더 적절합니다.
- t 분포
t 분포는 통계학에서 가설 검정 등에 사용되는 확률 분포입니다. t 분포는 정규 분포와 매우 유사한 형태를 가지고 있으며, 샘플의 크기가 작을 때 정규 분포 대신 사용됩니다. t 분포는 자유도 n에 따라 모양이 변하며 자유도 n이 커질 수록 표준 정규 분포 N(0, 1)에 수렴합니다.
t 분포는 표준 정규 분포처럼 0을 중심으로 종형의 모습을 가진 대칭 분포입니다. 또한 t 분포의 꼬리는 표준 정규 분포보다 두껍습니다. t 분포는 모집단의 분산(혹은 표준편차)이 알려져 있지 않은 경우에 정규분포 대신 이용하는 확률분포입니다.
- 자유도
자유도는 통계학에서 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수를 말합니다. 즉 자유도는 표본의 크기에서 1을 뺀 값입니다.
'Python > Study' 카테고리의 다른 글
[Python / Study] 비모수적 방법인 맨 - 휘트니 (Mann-Whitney) 검정 (0) | 2023.04.20 |
---|---|
[Python / Study] 정규성 검정에 대해 알아보기 (0) | 2023.04.20 |
[Python / Study] 단순확률추출 (simple random sampling) (0) | 2023.04.20 |
[Python / Study] 지도학습과 비지도학습 (0) | 2023.04.20 |
[Python / Study] 층화 표본 추출에 대한 공부 (0) | 2023.04.20 |