분산 2

[통계학] 기댓값과 분산

기댓값이란?기댓값(Expectation)은 확률 분포의 중심 경향을 나타내며, 확률 변수가 가질 수 있는 값들의 가중평균입니다. 기댓값은 확률 변수 $X$의 예상되는 평균값을 의미하며, 일반적으로 $E(X)$ 또는 $\mu$로 표기합니다. (확률 분포란? [통계학] 확률분포)(확률 변수란? [통계학] 확률변수) 이산 확률 변수의 기댓값이산 확률 변수 $X$의 기댓값은 각 값에 그 값이 발생할 확률을 곱한 후 합한 값으로 계산됩니다. 수식으로 표현하면 다음과 같습니다 $ E(X) = \sum_{i=1}^{n} x_i \cdot P(X = x_i) $$ x_i $는 확률 변수 $X$가 가질 수 있는 $i$번째 값입니다.$ P(X = x_i) $는 $X$가 $ x_i $​를 가질 확률입니다. 연속 확률 변수의..

Study/통계학 2024.08.15

[통계학] 자료의 중심과 퍼짐

이번 글에서는 통계학에서 자료의 중심과 퍼짐을 나타내는 척도에 대해서 살펴보겠습니다. 자료의 중심 척도에는 평균, 중앙값, 최빈값이 있습니다. 평균 (Mean) 평균은 모든 데이터의 합을 데이터의 개수로 나눈 값으로, 가장 많이 사용하는 척도입니다. 공식: (Σx_i) / n 여기서 x_i는 각 데이터 값이며, n은 데이터의 개수입니다. 중앙값 (Median) 중앙값은 데이터를 크기 순으로 정렬했을 때 가장 가운데 위치하는 값입니다. 데이터의 개수가 짝수일 경우, 가운데 두 값의 평균이 중앙값이 됩니다. 중앙값은 이상치에 영향을 받지 않아, 평균보다 데이터의 중심을 더 잘 나타낼 때도 있습니다. 최빈값 (Mode) 최빈값은 데이터에서 가장 자주 등장하는 값입니다. 범주형 데이터의 경우, 최빈값은 가장 많..

Study/통계학 2023.04.18