기댓값이란?
기댓값(Expectation)은 확률 분포의 중심 경향을 나타내며, 확률 변수가 가질 수 있는 값들의 가중평균입니다. 기댓값은 확률 변수 $X$의 예상되는 평균값을 의미하며, 일반적으로 $E(X)$ 또는 $\mu$로 표기합니다.
(확률 분포란? [통계학] 확률분포)
(확률 변수란? [통계학] 확률변수)
이산 확률 변수의 기댓값
이산 확률 변수 $X$의 기댓값은 각 값에 그 값이 발생할 확률을 곱한 후 합한 값으로 계산됩니다. 수식으로 표현하면 다음과 같습니다
$ E(X) = \sum_{i=1}^{n} x_i \cdot P(X = x_i) $
- $ x_i $는 확률 변수 $X$가 가질 수 있는 $i$번째 값입니다.
- $ P(X = x_i) $는 $X$가 $ x_i $를 가질 확률입니다.
연속 확률 변수의 기댓값
연속 확률 변수 $X$의 기댓값은 확률 밀도 함수 $ f(x) $를 사용하여 다음과 같이 계산됩니다
$ E(X) = \int_{-\infty}^{\infty} x \cdot f(x) \, dx $
- $ f(x) $는 확률 밀도 함수로, 특정 구간에서 확률 변수 $X$가 해당 값을 가질 확률을 나타냅니다.
분산이란?
분산(Variance)은 확률 분포의 변동성을 나타내며, 확률 변수 값들이 기댓값을 중심으로 얼마나 퍼져 있는지를 측정합니다. 분산은 기댓값으로부터의 편차의 제곱에 대한 평균으로 정의되며, 일반적으로 $ Var(X) $ 또는 $ \sigma^2 $로 표기합니다.
이산 확률 변수의 분산
이산 확률 변수 $X$의 분산은 다음과 같이 계산됩니다
$ Var(X) = E[(X - \mu)^2] = \sum_{i=1}^{n} (x_i - \mu)^2 \cdot P(X = x_i) $
- $ \mu $는 $X$의 기댓값입니다.
연속 확률 변수의 분산
연속 확률 변수 $X$의 분산은 다음과 같이 계산됩니다
$ Var(X) = E[(X - \mu)^2] = \int_{-\infty}^{\infty} (x - \mu)^2 \cdot f(x) \, dx $
몇가지 예제를 통해 더 자세히 살펴보겠습니다.
EX 1) 주사위 문제
정육면체 주사위를 한 번 던졌을 때 나올 수 있는 값은 1, 2, 3, 4, 5, 6입니다. 이 경우의 기댓값과 분산을 계산해보겠습니다.
기댓값: 각 면이 나올 확률은 동일하므로, 기댓값 ($E(X)$)은 다음과 같이 계산됩니다.
$ E(X) = \frac{1}{6} \cdot 1 + \frac{1}{6} \cdot 2 + \frac{1}{6} \cdot 3 + \frac{1}{6} \cdot 4 + \frac{1}{6} \cdot 5 + \frac{1}{6} \cdot 6 $
$ E(X) = \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5 $
따라서 주사위를 던졌을 때의 기댓값은 3.5입니다.
분산: 이제 분산 ($ Var(X) $)을 계산해보겠습니다.
각 값에서 기댓값을 빼고 제곱한 후, 이를 각각의 확률과 곱한 후 합산합니다.
$ Var(X) = \frac{1}{6} \cdot (1 - 3.5)^2 + \frac{1}{6} \cdot (2 - 3.5)^2 + \frac{1}{6} \cdot (3 - 3.5)^2 + \frac{1}{6} \cdot (4 - 3.5)^2 + \frac{1}{6} \cdot (5 - 3.5)^2 + \frac{1}{6} \cdot (6 - 3.5)^2 $
$ Var(X) = \frac{1}{6} \cdot [6.25 + 2.25 + 0.25 + 0.25 + 2.25 + 6.25] = \frac{17.5}{6} \approx 2.92 $
따라서 주사위를 던졌을 때의 분산은 약 2.92입니다.
EX 2) 동전 던지기
동전을 한 번 던져서 앞면이 나올 확률을 1로 간주하고, 뒷면이 나올 확률을 0으로 간주해보겠습니다. 이 경우의 기댓값과 분산을 계산해보겠습니다.
기댓값: 앞면이 나올 확률은 0.5이므로, 기댓값 ($ E(X) $)은 다음과 같이 계산됩니다
$ E(X) = 1 \cdot P(\text{앞면}) + 0 \cdot P(\text{뒷면}) = 1 \cdot 0.5 + 0 \cdot 0.5 = 0.5 $
따라서 동전 던지기의 기댓값은 0.5입니다.
분산: 분산 ($ Var(X) $)은 다음과 같이 계산됩니다
$ Var(X) = (1 - 0.5)^2 \cdot 0.5 + (0 - 0.5)^2 \cdot 0.5 = 0.25 \cdot 0.5 + 0.25 \cdot 0.5 = 0.25 $
따라서 동전 던지기의 분산은 0.25입니다.
오늘은 통계학에서의 기댓값과 분산에 대해 알아보았습니다.
오늘도 긴글 봐주셔서 감사합니다.
![](https://t1.daumcdn.net/keditor/emoticon/friends1/large/003.gif)
'Study > 통계학' 카테고리의 다른 글
[통계학] 기하분포 (0) | 2024.08.17 |
---|---|
[확률] 조건부 확률 (0) | 2024.08.13 |
[확률] 표본공간과 사건 (0) | 2024.08.12 |