본문 바로가기
통계학 용어

가설검정- t-검정과 카이제곱검정의 차이

by SEMOM 2023. 10. 23.
728x90

지난 포스팅에서 이야기한거처럼 이번에는 t-검정과 카이제곱검정의 차이를 알아보면서 좀더 이해를 돕도록 하겠습니다.

t-검정과 카이제곱 검정은 서로 다른 통계적 분석 방법인데 주요한 차이점을 살펴보면 각각의 분석이 어떤 내용인지 좀더 자세히 알수 있습니다.

1. 사용하는 데이터 유형

- t-검정
연속형 변수(예: 실수 값)를 가진 두 개의 독립적인 그룹 비교에 사용됩니다. t-검정은 평균의 차이를 검정하기 위해 사용되는 검정통계량입니다.

- 카이제곱 검정
범주형 변수(명목형 또는 순서형 변수)의 관찰 빈도를 분석하는 데 사용됩니다. 카이제곱 검정은 두 변수 간의 관련성 또는 독립성을 판단하기 위해 사용되는 검정통계량입니다.

잠깐 범주형변수의 뜻을 알아보겠습니다.

변주형 변수란?


범주형 변수는 데이터를 특정 범주로 분류하는 변수입니다. 범주형 변수에는 명목형 변수와 순서형 변수가 있습니다.

1. 명목형 변수
- 범주 간에 순서나 계층적 관계가 없는 변수입니다.
- 예시: 성별(남성, 여성), 혈액형(A, B, AB, O), 국가(한국, 미국, 중국)

2. 순서형 변수
- 범주 간에 순서나 계층적 관계가 있는 변수입니다.
- 예시: 학력(중졸, 고졸, 대졸, 석사, 박사)
/ 만족도(매우 불만족, 불만족, 보통, 만족, 매우 만족)/ 선호도(전혀 선호하지 않음, 약간 선호함, 매우 선호함)


2. 가설 검정 방향

- t-검정
주로 두 그룹 간의 평균 차이가 있는지를 확인하기 위해 사용됩니다. 일반적으로 귀무가설은 '평균이 같다'로 설정하며 반대로 대립가설은 '평균이 다르다'입니다.

- 카이제곱 검정: 범주형 변수 간의 독립성 또는 연관성을 평가하기 위해 사용됩니다. 귀무 가설은 '두 변수는 독립이다'이며, 대립 가설은 '두 변수는 독립이 아니다'입니다.

3. 통계량 및 분포

- t-검정
t-값을 계산하여 두 그룹의 평균 차이를 평가합니다. t-값은 t-분포표를 따릅니다.

- 카이제곱 검정
카이제곱 통계량을 계산하여 관찰된 빈도와 기대 빈도 간의 차이를 평가합니다. 카이제곱 통계량은 카이제곱 분포표를 따릅니다.

4. 데이터 전처리

- t-검정
데이터는 정규 분포를 따르거나 대략적으로 정규성을 만족한다는 전제하의 검정입니다.
- 카이제곱 검정
데이터는 독립적이어야 하며, 기대 빈도는 충분히 크거나 0이 아니어야 합니다.

위에서 언급한 차이점들을 고려하여, 분석하려는 변수의 유형과 목적에 따라 t-검정 또는 카이제곱 검정을 선택하여 분석하여야 올바른 통계분석을 할 수 있습니다.