포아송분포 (Poisson Distribution)
포아송분포는 일정한 시간이나 공간 내에서 어떤 사건이 발생하는 횟수를 모델링하는 이산 확률분포입니다.
포아송분포는 특정 단위 시간 또는 단위 공간 내에서 사건이 독립적으로 발생하며, 사건이 발생할 평균 횟수가 일정하다는 가정하에 사용됩니다.
포아송분포에서 확률변수 $X$는 주어진 시간이나 공간에서 사건이 발생한 횟수를 나타내며, 포아송분포의 확률 질량 함수(PMF)는 다음과 같이 주어집니다.
$ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \quad \text{for } k = 0, 1, 2, \dots $
- $ \lambda $는 단위 시간 또는 단위 공간에서 사건이 발생하는 평균 횟수(기댓값),
- $k$는 사건이 발생한 횟수,
- $e$는 자연로그의 밑, 약 2.718입니다.
기댓값
포아송분포의 기댓값을 구하기 위해 기댓값의 정의를 사용합니다.
$ E(X) = \sum_{k=0}^{\infty} k \cdot P(X = k) $
이를 포아송분포의 확률 질량 함수(PMF)에 대입하면
$ E(X) = \sum_{k=0}^{\infty} k \cdot \frac{\lambda^k e^{-\lambda}}{k!} $
이 식에서 $k$를 하나의 항으로 묶기 위해 $ k \cdot \frac{\lambda^k}{k!} $를 $ \lambda \cdot \frac{\lambda^{k-1}}{(k-1)!} $로 변형할 수 있습니다.
따라서
이 식을 $ j = k-1 $로 치환하여 다시 정리하면
$ E(X) = \lambda \sum_{j=0}^{\infty} \frac{\lambda^j e^{-\lambda}}{j!} $
이 합은 포아송분포의 성질에 의해 1로 수렴합니다.
따라서 기댓값은 $\lambda$가 되게 됩니다.
$ E(X) = \lambda $
분산
분산을 구하기 위해서는 $ E(X^2) $을 먼저 계산하고, 이를 이용해 분산을 구할 수 있습니다.
분산은 다음과 같이 정의됩니다.
$ \text{Var}(X) = E(X^2) - [E(X)]^2 $
우선 $ E(X^2) $을 계산해보겠습니다.
$ E(X^2) = \sum_{k=0}^{\infty} k^2 \cdot P(X = k) $
위의 식을 $ k^2 = k(k-1) + k $로 분해하여 다음과 같이 계산할 수 있습니다.
$ E(X^2) = \sum_{k=0}^{\infty} k(k-1) \cdot P(X = k) + \sum_{k=0}^{\infty} k \cdot P(X = k) $
첫 번째 항은 $ \lambda^2 $로 계산되며, 두 번째 항은 $ \lambda $입니다.
따라서 $E(X^2)$는 다음과 같습니다.
$ E(X^2) = \lambda^2 + \lambda $
이를 분산 정의에 대입하면
$ \text{Var}(X) = \lambda^2 + \lambda - \lambda^2 = \lambda $
따라서, 포아송분포의 분산은 $ \lambda $입니다.
오늘은 포아송분포의 개념, 기댓값, 분산에 대해 알아보았습니다.
오늘도 긴글 봐주셔서 감사합니다.
![](https://t1.daumcdn.net/keditor/emoticon/friends1/large/003.gif)
'Study > 통계학' 카테고리의 다른 글
[통계학] 카이제곱분포 (0) | 2025.01.16 |
---|---|
[통계학] 초기하분포 (0) | 2024.08.17 |
[통계학] 음이항분포 (2) | 2024.08.17 |