본문 바로가기
통계학 용어

이항분포와 베르누이 분포-성공이냐 실패냐 배타적 사건의 분포

by SEMOM 2023. 11. 1.
728x90

이항분포와 베르누이 분포에 대해 알아보고자 합니다. 이항분포는 베르누이 시행을 여러 번 시행한 결과를 나타내는 분포인데요, 이 때문에 이항분포를 설명하려면 베르누이 분포가 무엇인지 알아야 합니다.

1. 베르누이 분포란?

베르누이 분포는 베르누이 시행을 확률분포로 나타낸 것이라고 보면 됩니다. 베르누이 시행은 서로 배타적인 사건을 실행하는 것입니다. 예를 들면 성공이냐 실패냐의 사건이 있습니다.
일반적으로 성공은 1로, 실패는 0으로 표기합니다.
서로 배타적인 사건이라 함은 반드시 둘 중 하나의 결과가 있어야 하며 절대 동시에는 발행하지 않는 사건이어야 합니다.

2. 베르누이 분포에서의 성공확률

베르누이 분포에서는 각 시행에서의 성공 확률을 p로 표기합니다. 이는 고정된 값으로 가정합니다.
베르누이 분포는 단일 시행에서의 성공 확률 p에 따라 결정되며, 성공과 실패의 확률을 나타냅니다.

베르누이 분포는 보통 동전 던지기와 같이 상호 배타적인 결과를 가지는 실험을 분석할 때 사용됩니다. 동전 던지기의 결과는 반드시 앞면 혹은 뒷면이 나올 것이고, 앞면과 뒷면이 아닌 다른 경우의 수는 없습니다. 이런 사건을 상호 배타적인 결과를 가지는 사건이라고 합니다. 동전이 앞면이 나올 확률 p인 경우, 베르누이 분포를 사용하여 앞면이 나올 확률이나 뒷면이 나올 확률을 계산할 수 있습니다.

3. 이항분포란?

이항 분포는 서로 배타적인 예를 들면 성공과 실패의 결과를 가지는 베르누이 시행을 여러 번 반복해서 시행한 결과를 나타내기 위해 사용됩니다. 예를 들어, 동전 던지기에서 앞면이 나올 확률 p를 알고 있을 때, n번의 동전 던지기에서 앞면이 나올 횟수를 이항 분포를 사용하여 분석할 수 있습니다.

4. 이항분포 특징

이항 분포에서는 성공의 개수를 나타내는 확률 변수가 사용됩니다. 일반적으로 이를 X로 표기합니다.
각 시행에서의 성공 확률은 p로 표기합니다. 이는 고정된 값으로 가정합니다. 동전 던지기라면 앞면이 나올 확률 1/2가 p가 됩니다.
이항 분포에서는 독립적인 시행의 횟수를 n으로 표기합니다. 동전을 몇 번 던졌냐의 횟수겠죠.
이항 분포에서는 성공의 개수에 대한 확률 분포가 주어진 성공 확률 p와 시행 횟수 n에 따라 결정됩니다.

5. 이항분포를 활용하는 예

이항 분포를 사용하여 다양한 확률적 문제들을 해결할 수 있습니다. 동전 던지기를 5번 한다고 가정하여 보면 이항분포를 활용할 수 있는 예시들은 아래와 같습니다.

  • 앞면이 나올 횟수

동전을 5번 던져서 앞면이 나오는 횟수를 X라고 하면, X는 이항 분포를 따릅니다. 이를 통해 앞면이 나올 횟수가 0, 1, 2, 3, 4, 5일 확률을 계산할 수 있습니다.

  • 특정 횟수 이하로 앞면이 나올 확률

동전을 5번 던져서 앞면이 나오는 횟수가 3번 이하일 확률을 계산할 수 있습니다.

  • 평균 앞면 횟수

동전을 5번 던져서 평균적으로 앞면이 나오는 횟수를 계산할 수 있습니다.

  • 앞면 횟수의 분산

동전을 5번 던져서 앞면이 나오는 횟수의 분산을 계산할 수 있습니다.

6. 이항분포와 정규분포

이항분포에서 p가 0이나 1에 가깝지 않고 n이 충분히 크면 이항분포는 정규분포에 가까워집니다. 사실 이항분포는 변수들이 서로 떨어져 있는 이산확률분포의 일종이라 볼 수 있으며 정규분포는 변수들이 연속되어 있는 연속확률분포지만, n이 충분히 크면 정규분포에 가까워진다고 볼 수 있습니다. 이 때문에 n이 충분히 큰 이항분포는 정규분포로 근사화하여 정규분포와 같은 표준화된 통계량과 테스트를 사용할 수 있다는 이점이 있습니다.

이항분포는 생각보다 다양한 곳에서 0이냐 1이냐의 상호 배타적인 값으로 사건을 판단하는 확률분포에서 이용할 수 있는 분포입니다. 다음 포스팅에서는 이항분포를 계산하는 방법과 좀 더 일상에서 접할 수 있는 예시들을 알아보도록 하겠습니다.