1. 정의
F분포(F-Distribution)는 두 독립적인 카이제곱분포를 각각 자유도로 나눈 값의 비율로 정의되는 확률분포입니다. F분포는 주로 분산분석(ANOVA)와 회귀분석에서 모델 간의 분산 차이를 비교할 때 사용됩니다.
수학적 정의는 다음과 같습니다:
\[
F = \frac{\frac{X_1}{d_1}}{\frac{X_2}{d_2}}
\]
여기서:
- \( X_1 \sim \chi^2(d_1) \): 자유도 \( d_1 \)를 가지는 카이제곱분포를 따르는 확률변수.
- \( X_2 \sim \chi^2(d_2) \): 자유도 \( d_2 \)를 가지는 카이제곱분포를 따르는 확률변수.
- \( d_1 \): 분자의 자유도 (자유도1).
- \( d_2 \): 분모의 자유도 (자유도2).
F분포는 0 이상의 값을 가지며, 두 자유도 \( d_1 \)와 \( d_2 \)에 따라 분포의 형태가 달라집니다.
2. 기댓값과 증명
기댓값(E[F]):
F분포의 기댓값은 분자의 자유도가 2 이상일 때 정의되며, 다음과 같습니다:
\[
E[F] = \frac{d_2}{d_2 - 2}, \quad d_2 > 2
\]
증명:
F분포의 기댓값은 분자의 카이제곱분포와 분모의 카이제곱분포의 비율로 계산됩니다. 분자의 기대값은 \( \frac{d_1}{d_1} \), 분모의 기대값은 \( \frac{d_2}{d_2} \)로 나타나며, 분모의 자유도에 따라 결과가 달라집니다. 분모의 기대값이 정의되기 위해서는 \( d_2 > 2 \) 조건이 필요합니다.
3. 분산과 증명
분산(Var[F]):
F분포의 분산은 다음과 같이 계산됩니다:
\[
\text{Var}(F) = \frac{2d_2^2(d_1 + d_2 - 2)}{d_1(d_2 - 2)^2(d_2 - 4)}, \quad d_2 > 4
\]
증명:
분산은 F분포의 2차 모멘트를 계산한 후 기대값의 제곱을 빼서 얻어집니다. 이를 구하기 위해서는 고차 모멘트 계산이 필요하며, 분모의 자유도 \( d_2 \)가 4보다 커야 분산이 유한한 값으로 정의됩니다.
'Study > 통계학' 카테고리의 다른 글
[통계학] 카이제곱분포 (0) | 2025.01.16 |
---|---|
[통계학] 포아송분포 (0) | 2024.08.19 |
[통계학] 초기하분포 (0) | 2024.08.17 |