지난 포스팅에서 이야기한거처럼 이번에는 t-검정과 카이제곱검정의 차이를 알아보면서 좀더 이해를 돕도록 하겠습니다.
t-검정과 카이제곱 검정은 서로 다른 통계적 분석 방법인데 주요한 차이점을 살펴보면 각각의 분석이 어떤 내용인지 좀더 자세히 알수 있습니다.
1. 사용하는 데이터 유형
- t-검정
연속형 변수(예: 실수 값)를 가진 두 개의 독립적인 그룹 비교에 사용됩니다. t-검정은 평균의 차이를 검정하기 위해 사용되는 검정통계량입니다.
- 카이제곱 검정
범주형 변수(명목형 또는 순서형 변수)의 관찰 빈도를 분석하는 데 사용됩니다. 카이제곱 검정은 두 변수 간의 관련성 또는 독립성을 판단하기 위해 사용되는 검정통계량입니다.
잠깐 범주형변수의 뜻을 알아보겠습니다.
변주형 변수란?
범주형 변수는 데이터를 특정 범주로 분류하는 변수입니다. 범주형 변수에는 명목형 변수와 순서형 변수가 있습니다.
1. 명목형 변수
- 범주 간에 순서나 계층적 관계가 없는 변수입니다.
- 예시: 성별(남성, 여성), 혈액형(A, B, AB, O), 국가(한국, 미국, 중국)
2. 순서형 변수
- 범주 간에 순서나 계층적 관계가 있는 변수입니다.
- 예시: 학력(중졸, 고졸, 대졸, 석사, 박사)
/ 만족도(매우 불만족, 불만족, 보통, 만족, 매우 만족)/ 선호도(전혀 선호하지 않음, 약간 선호함, 매우 선호함)
2. 가설 검정 방향
- t-검정
주로 두 그룹 간의 평균 차이가 있는지를 확인하기 위해 사용됩니다. 일반적으로 귀무가설은 '평균이 같다'로 설정하며 반대로 대립가설은 '평균이 다르다'입니다.
- 카이제곱 검정: 범주형 변수 간의 독립성 또는 연관성을 평가하기 위해 사용됩니다. 귀무 가설은 '두 변수는 독립이다'이며, 대립 가설은 '두 변수는 독립이 아니다'입니다.
3. 통계량 및 분포
- t-검정
t-값을 계산하여 두 그룹의 평균 차이를 평가합니다. t-값은 t-분포표를 따릅니다.
- 카이제곱 검정
카이제곱 통계량을 계산하여 관찰된 빈도와 기대 빈도 간의 차이를 평가합니다. 카이제곱 통계량은 카이제곱 분포표를 따릅니다.
4. 데이터 전처리
- t-검정
데이터는 정규 분포를 따르거나 대략적으로 정규성을 만족한다는 전제하의 검정입니다.
- 카이제곱 검정
데이터는 독립적이어야 하며, 기대 빈도는 충분히 크거나 0이 아니어야 합니다.
위에서 언급한 차이점들을 고려하여, 분석하려는 변수의 유형과 목적에 따라 t-검정 또는 카이제곱 검정을 선택하여 분석하여야 올바른 통계분석을 할 수 있습니다.
'통계학 용어' 카테고리의 다른 글
이항분포의 계산- 이항분포의 평균, 분산 (0) | 2023.11.04 |
---|---|
이항분포와 베르누이 분포-성공이냐 실패냐 배타적 사건의 분포 (1) | 2023.11.01 |
가설검정- 검정통계량(t-검정과 카이제곱검정) (0) | 2023.10.21 |
기초통계- 순열과 조합 (0) | 2023.10.20 |
설문지를 잘 만드는 법- 통계적으로 잘못된 설문의 예 (0) | 2023.10.19 |