Study/통계학

[통계학] 카이제곱분포

더움바다 2025. 1. 16. 23:16

1. 정의
카이제곱분포(Chi-Square Distribution)는 통계학에서 매우 중요한 분포로, 주로 가설 검정과 분산 분석에 사용됩니다. 이 분포는 서로 독립적인 표준정규분포를 따르는 확률변수 \( Z_1, Z_2, ..., Z_k \)의 제곱합으로 정의됩니다.

수학적 정의는 다음과 같습니다:

\[
X = \sum_{i=1}^{k} Z_i^2
\]

여기서:
- \( Z_i \)는 표준정규분포 \( N(0, 1) \)를 따르는 독립적인 확률변수입니다.
- \( k \)는 자유도(degree of freedom)라고 하며, 카이제곱분포의 형태를 결정하는 중요한 매개변수입니다.

카이제곱분포는 항상 0 이상의 값을 가지며, 자유도가 증가할수록 분포의 형태가 정규분포에 가까워집니다.


2. 기댓값과 증명

기댓값(E[X]):
카이제곱분포의 기댓값은 자유도 \( k \)와 같습니다.

\[
E[X] = k
\]

증명:
표준정규분포를 따르는 \( Z_i \)의 제곱은 분산이 \( 1 \), 기댓값이 \( 0 \)인 경우이므로, 각 \( Z_i^2 \)의 기댓값은 다음과 같이 계산됩니다:

\[
E[Z_i^2] = \text{Var}(Z_i) + (E[Z_i])^2 = 1 + 0^2 = 1
\]

따라서 \( X = \sum_{i=1}^{k} Z_i^2 \)의 기댓값은:

\[
E[X] = \sum_{i=1}^{k} E[Z_i^2] = k \cdot 1 = k
\]


3. 분산과 증명

분산(Var[X]):
카이제곱분포의 분산은 \( 2k \)입니다.

\[
\text{Var}(X) = 2k
\]

증명:
카이제곱분포의 확률변수 \( Z_i^2 \)는 분산이 2인 분포를 따릅니다. 따라서 각 \( Z_i^2 \)의 분산은 2입니다. 독립적인 확률변수의 분산은 단순히 합산되므로:

\[
\text{Var}(X) = \sum_{i=1}^{k} \text{Var}(Z_i^2) = k \cdot 2 = 2k
\]


'Study > 통계학' 카테고리의 다른 글

[통계학] F분포  (1) 2025.01.16
[통계학] 포아송분포  (0) 2024.08.19
[통계학] 초기하분포  (0) 2024.08.17