Study/통계학 25

[통계학] 공분산과 상관관계

📘 공분산과 상관관계: 두 변수 간의 관계 분석공분산(Covariance)과 상관계수(Correlation Coefficient)는 두 변수 간의 관계를 계량적으로 설명할 수 있는 대표적인 통계 지표이다. 이 글에서는 이 두 개념의 정의, 수식, 해석, 그리고 실제 예제를 중심으로 두 지표를 비교 설명한다.1. 공분산(Covariance)의 정의 및 해석공분산은 두 확률 변수 간의 함께 변화하는 정도(co-movement)를 측정하는 지표이다.표본 공분산은 다음과 같이 정의된다:$\mathrm{Cov}(X, Y) = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})(Y_i - \bar{Y}) = \mathrm{E}(XY) - \mathrm{E}(X)\mathrm{E}(Y)$$..

Study/통계학 2025.04.16

[통계학] F분포

1. 정의F분포(F-Distribution)는 두 독립적인 카이제곱분포를 각각 자유도로 나눈 값의 비율로 정의되는 확률분포입니다. F분포는 주로 분산분석(ANOVA)와 회귀분석에서 모델 간의 분산 차이를 비교할 때 사용됩니다.수학적 정의는 다음과 같습니다:\[F = \frac{\frac{X_1}{d_1}}{\frac{X_2}{d_2}}\]여기서:- \( X_1 \sim \chi^2(d_1) \): 자유도 \( d_1 \)를 가지는 카이제곱분포를 따르는 확률변수.- \( X_2 \sim \chi^2(d_2) \): 자유도 \( d_2 \)를 가지는 카이제곱분포를 따르는 확률변수.- \( d_1 \): 분자의 자유도 (자유도1).- \( d_2 \): 분모의 자유도 (자유도2).F분포는 0 이상의 값을 가지..

Study/통계학 2025.01.16

[통계학] 카이제곱분포

1. 정의카이제곱분포(Chi-Square Distribution)는 통계학에서 매우 중요한 분포로, 주로 가설 검정과 분산 분석에 사용됩니다. 이 분포는 서로 독립적인 표준정규분포를 따르는 확률변수 \( Z_1, Z_2, ..., Z_k \)의 제곱합으로 정의됩니다.수학적 정의는 다음과 같습니다:\[X = \sum_{i=1}^{k} Z_i^2\]여기서:- \( Z_i \)는 표준정규분포 \( N(0, 1) \)를 따르는 독립적인 확률변수입니다.- \( k \)는 자유도(degree of freedom)라고 하며, 카이제곱분포의 형태를 결정하는 중요한 매개변수입니다.카이제곱분포는 항상 0 이상의 값을 가지며, 자유도가 증가할수록 분포의 형태가 정규분포에 가까워집니다.2. 기댓값과 증명기댓값(E[X]):카이..

Study/통계학 2025.01.16

[통계학] 포아송분포

포아송분포 (Poisson Distribution)포아송분포는 일정한 시간이나 공간 내에서 어떤 사건이 발생하는 횟수를 모델링하는 이산 확률분포입니다.포아송분포는 특정 단위 시간 또는 단위 공간 내에서 사건이 독립적으로 발생하며, 사건이 발생할 평균 횟수가 일정하다는 가정하에 사용됩니다. 포아송분포에서 확률변수 $X$는 주어진 시간이나 공간에서 사건이 발생한 횟수를 나타내며, 포아송분포의 확률 질량 함수(PMF)는 다음과 같이 주어집니다. $ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} \quad \text{for } k = 0, 1, 2, \dots $ $ \lambda $는 단위 시간 또는 단위 공간에서 사건이 발생하는 평균 횟수(기댓값),$k$는 사건이 발생한 횟..

Study/통계학 2024.08.19

[통계학] 초기하분포

초기하분포 (Hypergeometric Distribution)초기하분포(Hypergeometric Distribution)는 유한한 모집단에서 비복원 추출을 통해 얻은 표본에서 특정 속성을 가진 항목의 수를 모델링하는 분포입니다.초기하분포는 모집단에서의 성공과 실패를 구분하며, 이항분포와는 달리 비복원 추출을 사용합니다. 초기하분포의 확률변수 $X$는 $N$개의 모집단에서 $n$개의 표본을 추출할 때, $K$개의 성공 항목 중에서 $k$개의 성공 항목을 뽑을 확률을 나타냅니다. 초기하분포의 확률 질량 함수(PMF)는 다음과 같이 주어집니다. $ P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} $ $N$은 모집단의 크기를 나타냅니다.$K$는 ..

Study/통계학 2024.08.17