1. 정의
카이제곱분포(Chi-Square Distribution)는 통계학에서 매우 중요한 분포로, 주로 가설 검정과 분산 분석에 사용됩니다. 이 분포는 서로 독립적인 표준정규분포를 따르는 확률변수 \( Z_1, Z_2, ..., Z_k \)의 제곱합으로 정의됩니다.
수학적 정의는 다음과 같습니다:
\[
X = \sum_{i=1}^{k} Z_i^2
\]
여기서:
- \( Z_i \)는 표준정규분포 \( N(0, 1) \)를 따르는 독립적인 확률변수입니다.
- \( k \)는 자유도(degree of freedom)라고 하며, 카이제곱분포의 형태를 결정하는 중요한 매개변수입니다.
카이제곱분포는 항상 0 이상의 값을 가지며, 자유도가 증가할수록 분포의 형태가 정규분포에 가까워집니다.
2. 기댓값과 증명
기댓값(E[X]):
카이제곱분포의 기댓값은 자유도 \( k \)와 같습니다.
\[
E[X] = k
\]
증명:
표준정규분포를 따르는 \( Z_i \)의 제곱은 분산이 \( 1 \), 기댓값이 \( 0 \)인 경우이므로, 각 \( Z_i^2 \)의 기댓값은 다음과 같이 계산됩니다:
\[
E[Z_i^2] = \text{Var}(Z_i) + (E[Z_i])^2 = 1 + 0^2 = 1
\]
따라서 \( X = \sum_{i=1}^{k} Z_i^2 \)의 기댓값은:
\[
E[X] = \sum_{i=1}^{k} E[Z_i^2] = k \cdot 1 = k
\]
3. 분산과 증명
분산(Var[X]):
카이제곱분포의 분산은 \( 2k \)입니다.
\[
\text{Var}(X) = 2k
\]
증명:
카이제곱분포의 확률변수 \( Z_i^2 \)는 분산이 2인 분포를 따릅니다. 따라서 각 \( Z_i^2 \)의 분산은 2입니다. 독립적인 확률변수의 분산은 단순히 합산되므로:
\[
\text{Var}(X) = \sum_{i=1}^{k} \text{Var}(Z_i^2) = k \cdot 2 = 2k
\]
'Study > 통계학' 카테고리의 다른 글
[통계학] F분포 (1) | 2025.01.16 |
---|---|
[통계학] 포아송분포 (0) | 2024.08.19 |
[통계학] 초기하분포 (0) | 2024.08.17 |