정규분포 (Normal Distribution)
정규분포는 연속 확률분포의 하나로, 종 모양의 대칭적인 곡선 형태를 가집니다. 이는 데이터가 평균을 중심으로 대칭적으로 분포하며, 평균으로부터 멀어질수록 데이터의 빈도가 낮아지는 특성을 가지고 있습니다.
정규분포의 확률 밀도 함수(PDF)는 다음과 같이 주어집니다.
$ f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $
- $ \mu $는 정규분포의 평균(기댓값)입니다.
- $ \sigma^2 $는 정규분포의 분산입니다.
- $ \sigma $는 정규분포의 표준편차입니다.
기댓값
기댓값 $E(X)$는 확률변수 $X$의 평균값으로, 확률 밀도 함수$f(x)$를 사용하여 다음과 같이 정의됩니다.
$ E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx $
이제 이 식에 정규분포의 확률 밀도 함수를 대입합니다.
$ E(X) = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx $
이 적분을 풀기 위해, 변수를 $ z = \frac{x - \mu}{\sigma} $로 치환합니다. 치환을 사용하면 $ x = \sigma z + \mu $가 되고, $ dx = \sigma dz $가 됩니다.
적분 범위는 $z$가 $ -\infty $에서 $ \infty $까지 변합니다. 따라서 적분식은 다음과 같이 변형됩니다.
$ E(X) = \int_{-\infty}^{\infty} (\sigma z + \mu) \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz $
위 식을 두 개의 적분으로 나눌 수 있습니다.
$ E(X) = \frac{1}{\sqrt{2\pi}} \left[ \sigma \int_{-\infty}^{\infty} z \cdot e^{-\frac{z^2}{2}} \, dz + \mu \int_{-\infty}^{\infty} e^{-\frac{z^2}{2}} \, dz \right] $
위 식에서 두 항의 의미는 다음과 같습니다.
- 첫 번째 항: $z$에 대한 적분입니다. 이 적분은 정규분포의 특성상 0이 됩니다. 왜냐하면 $z$는 기함수(odd function)이기 때문입니다. 기함수의 적분은 대칭적이므로 $z$의 적분값은 0입니다.
- 두 번째 항: 이는 표준정규분포의 확률 밀도 함수에 대한 적분으로, 이 값은 1이 됩니다. 왜냐하면 정규분포의 확률 밀도 함수의 총 면적이 1이기 때문입니다.
$ \int_{-\infty}^{\infty} e^{-\frac{z^2}{2}} \, dz = \sqrt{2\pi} $
따라서 정규분포의 기댓값은 $\mu$입니다.
$ E(X) = \mu \cdot \frac{\sqrt{2\pi}}{\sqrt{2\pi}} = \mu $
분산
이제 분산 $ \text{Var}(X) $을 구해보겠습니다.
분산은 기댓값으로부터의 편차의 제곱에 대한 평균을 의미합니다. 수식으로는 다음과 같습니다.
$ \text{Var}(X) = E[(X - \mu)^2] = E(X^2) - [E(X)]^2 $
이제 $ E(X^2) $를 먼저 계산한 후, 이를 사용하여 분산을 구하겠습니다.
$ E(X^2) $는 다음과 같이 계산됩니다.
$ E(X^2) = \int_{-\infty}^{\infty} x^2 \cdot f(x) \, dx $
이를 정규분포의 확률 밀도 함수에 대입하면
$ E(X^2) = \int_{-\infty}^{\infty} x^2 \cdot \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx $
여기서 $ x^2 $를 치환을 통해 $ (x - \mu) $에 대한 표현으로 변환할 수 있습니다.
$ x^2 = (x - \mu)^2 + 2\mu x - \mu^2 $
이 식을 사용하면 적분은 다음과 같이 분리됩니다.
$ E(X^2) = \int_{-\infty}^{\infty} \left[(x - \mu)^2 + 2\mu x + \mu^2\right] \cdot f(x) \, dx $
- 첫 번째 항: $ (x - \mu)^2 $는 $ \sigma^2 $에 대한 기대값을 나타내며, 이는 분산입니다.
- 두 번째 항: $ 2\mu x $는 대칭성 때문에 0이 됩니다.
- 세 번째 항: $ \mu^2 $는 기댓값을 고려한 값입니다.
따라서 $ E(X^2) $는 다음과 같이 정리할 수 있습니다.
$ E(X^2) = \sigma^2 + \mu^2 $
이제 분산을 구해보겠습니다.
$ E(X^2) = \sigma^2 + \mu^2 $, $ E(X) = \mu $이므로 계산을 해보면 다음과 같습니다.
$ \text{Var}(X) = (\sigma^2 + \mu^2) - \mu^2 = \sigma^2 $
따라서 분산은 $ \sigma^2 $입니다.
표준정규분포 (Standard Normal Distribution)
표준정규분포는 정규분포의 특별한 형태로, 평균이 0이고 분산이 1인 정규분포를 말합니다. 이는 모든 정규분포를 평균 0, 표준편차 1로 표준화한 분포입니다. 표준정규분포는 $Z$로 표기되며, 확률 밀도 함수(PDF)는 다음과 같이 주어집니다.
$ f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} $
- $z$는 표준화된 값으로, 원래 데이터 값에서 평균을 뺀 후 표준편차로 나눈 값입니다.
기댓값
표준정규분포의 기댓값을 구하기 위해, 확률 밀도 함수(PDF)를 사용하여 다음과 같이 정의합니다.
$ E(Z) = \int_{-\infty}^{\infty} z \cdot f(z) \, dz $
이를 표준정규분포의 PDF에 대입하면
$ E(Z) = \int_{-\infty}^{\infty} z \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz $
여기서 $ z \cdot e^{-\frac{z^2}{2}} $는 기함수(odd function)로, 적분의 값이 0이 됩니다.
$ E(Z)=0 $
분산
표준정규분포의 분산은 다음과 같이 계산할 수 있습니다.
$ \text{Var}(Z) = E(Z^2) - [E(Z)]^2 $
먼저 $ E(Z^2) $를 계산해보겠습니다.
$ E(Z^2) = \int_{-\infty}^{\infty} z^2 \cdot f(z) \, dz $
이를 표준정규분포의 PDF에 대입하면
$ E(Z^2) = \int_{-\infty}^{\infty} z^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}} \, dz $
이 적분은 정규분포의 성질로 인해 분산이 1이 됨을 보여줍니다.
$ \text{Var}(Z) = 1$
오늘은 정규분포와 표준정규분포의 개념, 기댓값, 분산에 대해 알아보았습니다.
오늘도 긴글 봐주셔서 감사합니다.
![](https://t1.daumcdn.net/keditor/emoticon/friends1/large/003.gif)
'Study > 통계학' 카테고리의 다른 글
[확률] 순열 (0) | 2024.07.14 |
---|---|
[통계학] 베르누이 분포와 이항 분포 (0) | 2023.10.03 |
[통계학] 확률분포 (0) | 2023.10.02 |