포아송분포란 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산확률분포의 한 종류입니다. 지난 시간에 알아본 이항분포도 이산확률분포 중 하나인데요.
여기서 잠깐 이산확률분포의 뜻을 알아보면 다음과 같습니다.
1. 이산확률분포란?
이산 확률 분포는 확률 변수가 이산적인(discrete) 값을 가지는 확률 분포를 의미합니다. 이산적인 값은 유한한 개수 또는 셀 수 있는 개수의 값을 가지며, 연속적이지 않습니다. 대표적으로 이항분포와 지금 알아볼 포아송분포가 있습니다.
반대되는 개념으로는 연속확률분포가 있으며 확률 변수가 연속적인(continuous) 값을 가지는 확률 분포를 의미합니다. 연속적인 값은 무한히 많은 값을 가지며, 실수 범위 내에서 모든 가능한 값을 가질 수 있습니다. 대표적으로 정규분포, 지수분포 등이 있습니다.
2. 포아송분포란?
포아송 분포는 특정 시간 또는 공간 단위에서 발생하는 사건의 수를 모델링하는 확률 분포입니다. 이 분포는 일어날 사건의 평균 발생률(lambda, λ)을 기반으로 합니다.
포아송 분포의 특징을 살펴보면 아래와 같습니다.
1. 포아송 분포에서 각 사건은 서로 독립적이며, 한 사건의 발생이 다른 사건의 발생에 영향을 주지 않습니다.
2. 일정한 시간 또는 공간 단위에서 사건이 발생하는 평균적인 비율이 일정합니다. 이 평균 발생률(lambda)은 분포의 모수(parameter)로 사용됩니다.
3. 포아송 분포는 이산 확률 분포로, 정수 값인 사건의 개수를 모델링합니다. 음이 아닌 정수 값만을 가질 수 있습니다.
3. 포아송분포의 예시
포아송 분포는 다양한 상황에서 사용됩니다. 예를 들어, 아래와 같은 경우에 포아송 분포를 적용할 수 있습니다.
1. 고객 서비스 대기 시간 동안 고객의 도착 횟수
2. 웹사이트 방문자 수
3. 전화 통화 수
4. 사고 발생 횟수
5. 결함이 발생하는 제품 수
포아송 분포를 사용하여 특정 시간 또는 공간 단위에서 발생하는 사건의 확률이나 발생 횟수를 계산할 수 있습니다. 이를 통해 사건의 발생 패턴을 분석하고, 사건을 예측하는데 활용할 수 있습니다.
4. 포아송분포의 계산
포아송분포를 계산하는 식은 아래와 같습니다.
P(X = k) = (e^(-λ) * λ^k) / k!
여기서 X는 사건의 개수를 나타내는 확률변수이고, k는 구하고자 하는 특정 사건의 개수입니다.
좀 더 구체적으로 살펴보도록 하겠습니다.
5분 동안 2개의 사건이 발생할 확률을 포아송 분포를 사용하여 계산하는 과정입니다. 단, 평균 발생률(lambda, λ) 값을 알아야 정확한 계산이 가능하고 평균 발생률을 3으로 가정하겠습니다.
P(X = 2) = (e^(-λ) * λ^2) / 2!
여기서 λ = 3로 가정하면,
P(X = 2) = (e^(-3) * 3^2) / 2!
이를 계산하면, 약 0.224로 나타납니다. 즉, 5분 동안 2개의 사건이 발생할 확률은 약 0.224, 즉 22.4%입니다.
평균 발생률(lambda, λ) 값이 다른 경우에도 위의 공식을 사용하여 확률을 계산할 수 있습니다.
포아송분포도 실제 사례에서 많이 사용할 수 있는 통계적 확률 계산 중 하나이니 잘 숙지해 두었다가 활용해 보면 도움이 될 것이라고 생각합니다.
'통계학 용어' 카테고리의 다른 글
분산분석(ANOVA)-일원분산분석 (0) | 2023.11.18 |
---|---|
조건부확률-베이즈정리란? 기저율오류 (1) | 2023.11.14 |
이항분포의 계산- 이항분포의 평균, 분산 (0) | 2023.11.04 |
이항분포와 베르누이 분포-성공이냐 실패냐 배타적 사건의 분포 (1) | 2023.11.01 |
가설검정- t-검정과 카이제곱검정의 차이 (1) | 2023.10.23 |