Study/통계학

[통계학] F분포

더움바다 2025. 1. 16. 23:20

1. 정의
F분포(F-Distribution)는 두 독립적인 카이제곱분포를 각각 자유도로 나눈 값의 비율로 정의되는 확률분포입니다. F분포는 주로 분산분석(ANOVA)와 회귀분석에서 모델 간의 분산 차이를 비교할 때 사용됩니다.

수학적 정의는 다음과 같습니다:

\[
F = \frac{\frac{X_1}{d_1}}{\frac{X_2}{d_2}}
\]

여기서:
- \( X_1 \sim \chi^2(d_1) \): 자유도 \( d_1 \)를 가지는 카이제곱분포를 따르는 확률변수.
- \( X_2 \sim \chi^2(d_2) \): 자유도 \( d_2 \)를 가지는 카이제곱분포를 따르는 확률변수.
- \( d_1 \): 분자의 자유도 (자유도1).
- \( d_2 \): 분모의 자유도 (자유도2).

F분포는 0 이상의 값을 가지며, 두 자유도 \( d_1 \)와 \( d_2 \)에 따라 분포의 형태가 달라집니다.


2. 기댓값과 증명

기댓값(E[F]):
F분포의 기댓값은 분자의 자유도가 2 이상일 때 정의되며, 다음과 같습니다:

\[
E[F] = \frac{d_2}{d_2 - 2}, \quad d_2 > 2
\]

증명:
F분포의 기댓값은 분자의 카이제곱분포와 분모의 카이제곱분포의 비율로 계산됩니다. 분자의 기대값은 \( \frac{d_1}{d_1} \), 분모의 기대값은 \( \frac{d_2}{d_2} \)로 나타나며, 분모의 자유도에 따라 결과가 달라집니다. 분모의 기대값이 정의되기 위해서는 \( d_2 > 2 \) 조건이 필요합니다.


3. 분산과 증명

분산(Var[F]):
F분포의 분산은 다음과 같이 계산됩니다:

\[
\text{Var}(F) = \frac{2d_2^2(d_1 + d_2 - 2)}{d_1(d_2 - 2)^2(d_2 - 4)}, \quad d_2 > 4
\]

증명:
분산은 F분포의 2차 모멘트를 계산한 후 기대값의 제곱을 빼서 얻어집니다. 이를 구하기 위해서는 고차 모멘트 계산이 필요하며, 분모의 자유도 \( d_2 \)가 4보다 커야 분산이 유한한 값으로 정의됩니다.


'Study > 통계학' 카테고리의 다른 글

[통계학] 카이제곱분포  (0) 2025.01.16
[통계학] 포아송분포  (0) 2024.08.19
[통계학] 초기하분포  (0) 2024.08.17