가설검정을 할 때에는 선택한 검정 방법에 따라 적절한 검정통계량을 계산하여야 합니다. 여러가지 검정통계량이 있지만 이번에는 대표적으로 사용되는 t-검정과 카이제곱검정을 알아보고자 합니다.
1. t-검정이란?
t-검정은 두 집단 간의 평균 차이를 검정하기 위해 사용되는 통계적인 방법입니다. 특히, 작은 샘플 크기에서 모집단의 평균 차이를 검정하는 데 유용합니다.
t-검정의 가설은 아래와 같이 설정합니다.
* 귀무가설(H0): 두 집단 간 평균에는 차이가 없다.
* 대립가설(H1): 두 집단 간 평균에는 차이가 있다.
2. t-검정의 과정
t-검정은 아래와 같이 진행합니다.
1. 두 집단의 샘플 데이터를 사용하여 각 집단의 평균, 표준편차, 그리고 샘플 크기를 계산합니다.
2. 두 집단의 평균 차이를 계산합니다.
3. 각 집단의 분산을 고려하여 t-값을 계산합니다. 일반적으로는 다음과 같은 공식을 사용합니다
t-값 = (두 집단의 평균 차이) / (평균 차이의 표준오차)
4. 계산된 t-값을 자유도에 따라 t-분포 분포표를 보고 유의수준에 따른 검정 결과를 도출합니다. 일반적으로 유의수준은 0.05 또는 0.01을 사용합니다.
5. 유의수준보다 작은 경우, 귀무가설을 기각하고 대립가설을 채택합니다. 즉, 두 집단 간의 평균 차이가 있다는 결론으로 해석합니다.
3. t-검정의 예시
t-검정을 사용하는 예를 살펴보면 어떠한 검정통계량인지 보다 알기 쉬울 것 같습니다.
1. 어떤 신약의 효과를 확인하기 위해 환자들을 두 그룹으로 나누고, 한그룹에는 신약을 다른 한 그룹에는 위약(가짜약)을 투여하여 각 그룹의 평균 반응 시간을 측정한 후, 두 그룹 간의 평균 차이가 있는지 검정할 수 있습니다.
2. 한 제품의 개선 전후에 대한 소비자 만족도 평가를 할 수 있습니다. 한 그룹은 개선된 제품을 사용하도록 하고 다른 한 그룹은 개선되지 않은 제품을 사용하도록 하여 그룹 간의 평균 만족도를 측정한 후, 두 그룹 간에 유의한 차이가 있는지를 검정할 수 있습니다.
4. 카이제곱검정이란?
카이제곱 검정은 범주형 변수 간의 관련성을 검정하기 위해 사용되는 통계적인 방법입니다. 이 검정은 관찰된 데이터와 기대되는 이론적인 분포 사이의 차이를 평가하여, 두 변수 간의 독립성 여부를 판단합니다. 말이 좀 어려운데 아래에서 예시를 살펴보면 이해가 더 빠를 것입니다.
카이제곱 검정의 가설은 아래와 같습니다.
- 귀무가설(H0): 두 변수 간에는 독립성이 있다.
- 대립가설(H1): 두 변수 간에는 독립성이 없다.
5. 카이제곱검정의 과정
1. 관찰된 데이터를 이용하여 범주형 변수들 간의 도수표를 작성합니다.
2. 기대되는 이론적인 분포를 가정하고, 기대도수를 계산합니다.
3. 관찰된 도수와 기대도수 간의 차이를 계산하여 카이제곱 통계량을 구합니다.
카이제곱 통계량 = Σ [(관찰된 도수 - 기대도수)^2 / 기대도수]
4. 카이제곱 통계량을 자유도에 따라 카이제곱 분포표에서의 임계값과 비교하여 유의수준에 따라 검정 결과를 도출합니다. t-분포와 마찬가지로 유의수준은 일반적으로 0.05 또는 0.01이 사용됩니다.
5. 유의수준보다 작은 경우, 귀무가설을 기각하고 대립가설을 채택합니다. 즉, 변수들 간에 독립성이 없다는 증거로 해석됩니다.
6. 카이제곱검정의 예시
1. 광고 유형과 구매 여부 간의 관련성을 알고 싶을 때, 광고 유형에 따라 구매 여부의 도수를 측정하고, 이를 카이제곱 검정을 통해 검증할 수 있습니다. 이를 통해 광고 유형과 구매 여부 간에 통계적으로 유의한 관련성이 있는지를 확인할 수 있습니다.
2. 성별과 선호하는 음식 종류 간의 관련성을 알아보는 경우입니다. 성별에 따라 음식 종류의 도수를 측정하고, 카이제곱 검정을 통해 성별과 음식 종류 간에 유의한 관련성이 있는지를 판단할 수 있습니다.
처음 접할때 카이제곱검정을 이해하기 어려웠는데 다음 포스트를 통해 t-검정과 카이제곱검정을 비교해보면 이해를 도울 수 있을 것 같습니다.
'통계학 용어' 카테고리의 다른 글
이항분포와 베르누이 분포-성공이냐 실패냐 배타적 사건의 분포 (1) | 2023.11.01 |
---|---|
가설검정- t-검정과 카이제곱검정의 차이 (1) | 2023.10.23 |
기초통계- 순열과 조합 (0) | 2023.10.20 |
설문지를 잘 만드는 법- 통계적으로 잘못된 설문의 예 (0) | 2023.10.19 |
회귀분석-회귀모형의 유의성 평가 ,F-통계량 (1) | 2023.10.19 |