본문 바로가기
통계학 용어

분산분석(ANOVA)-일원분산분석

by SEMOM 2023. 11. 18.
728x90

이번에 알아볼 통계학 개념은 분산분석 중에서도 일원분산분석입니다.
분산분석은 아노바(ANOVA, Analysis of Variance) 분석이라고 불립니다.

1. 일원분산분석(One-Way ANOVA) 이란?

일원분산분석(One-Way ANOVA)은 세 개 이상의 그룹 간의 평균 차이를 비교하는 통계적 분석 방법입니다. 하나의 독립 변수와 그룹 내의 변동성을 분석합니다.

예를 들어, 한 약품을 다른 세 가지 용량으로 테스트하여 효과를 비교하고자 할 때 일원분산분석을 사용할 수 있습니다. 이를 통해 각 용량의 그룹 간 평균 차이가 통계적으로 유의미한지를 확인할 수 있습니다.

2. 일원분산분석의 전제조건

일원분산분석은 아래와 같은 가정을 전제합니다.

1. 각 그룹은 서로 독립적이어야 합니다.(독립성)
2. 각 그룹 내의 데이터는 정규분포를 따라야 합니다.(정규성)
3. 각 그룹의 데이터는 분산이 동일해야 합니다.
(등분산성)

아노바 분석은 전체 변동성을 그룹 간 변동성과 그룹 내 변동성으로 분해합니다. 이를 통해 그룹 간의 차이가 우연에 의한 것인지 통계적으로 유의한 차이에 의해 발행한 것인지를 판단할 수 있습니다. 아노바 분석의 결과로 F-통계량의 p-value를 도출하여  p-value가 작을수록 그룹 간의 차이가 통계적으로 유의미하다는 의미입니다.

3. 일원분산분석의 예시

예를 들어, 한 가게에서 세 가지 다른 광고 전략(A, B, C)을 적용하여 판매량을 측정하고자 한다고 가정해 보겠습니다. 이때, 일원분산분석을 사용하여 세 가지 다른 광고 전략 간의 평균 판매량에서 차이가 있는지 확인할 수 있습니다.

가게는 무작위로 선택한 30일 동안 세 가지 광고 전략을 각각 10일씩 적용합니다. 그리고 각각의 날짜에 해당하는 판매량을 기록합니다. 우리는 이렇게 얻은 데이터를 이용하여 일원분산분석을 수행할 수 있습니다.

가설은 아래와 같습니다.
- 귀무가설(H0): 광고 전략(A, B, C) 간의 평균 판매량에 차이가 없다.
- 대립가설(H1): 광고 전략(A, B, C) 간의 평균 판매량에 차이가 있다.

일원분산분석의 과정은 아래와 같습니다.

1. 데이터 수집: 각 광고 전략(A, B, C)에 대한 판매량 데이터를 수집합니다.

2. 가정 확인: 독립성, 정규성, 등분산성 가정을 확인합니다. 위에서 이야기한 바와 같이 세 가지 가정이 충족되어야 일원분산분석을 수행할 수 있기 때문입니다.

3. 일원분산분석 수행: 수집한 데이터를 이용하여 일원분산분석을 수행합니다.

4. 결과 해석: F-통계량과 p-value를 확인하여 귀무가설을 기각하거나 채택합니다.

   - p-value < 유의 수준(일반적으로 0.05로 설정) 일 경우 귀무가설을 기각합니다. 즉, 광고 전략 간의 평균 판매량에 유의미한 차이가 있다고 판단합니다.
   - p-value >= 유의수준일 경우 귀무가설을 채택합니다. 즉, 광고 전략 간의 평균 판매량에 유의미한 차이가 없다고 판단합니다.

이렇게 일원분산분석을 통해 광고 전략(A, B, C) 간의 평균 판매량 차이를 비교하여 어떤 전략이 가장 효과적인지를 판단할 수 있습니다.