This is an old revision of the document!
Table of Contents
Week 3 내용
Central Tendency
- Central Tendency (집중경향)
- Dispersion (variability) – 분산(변산성)
- outliers: It is beyond our scope. Please just refer to it. Won't be appearing in tests.
- Variance 분산 혹은 변량
- 표본변량 $ s^2 $
- 모집단변량(전집) $ \sigma^2 $
- Standard Deviation 표준편차
-
Sampling Distribution, Standard Error
CLT에 관한 정리
우선, Expected value (기대값)와 Variance (분산)의 연산은 아래와 같이 계산될 수 있다.
X,Y 가 서로 독립적이라고 할 때:
\begin{eqnarray}
E[aX] = a E[X] \\
E[X+Y] = E[X] + E[Y] \\
Var[aX] = a^{\tiny{2}} Var[X] \\
Var[X+Y] = Var[X] + Var[Y]
\end{eqnarray}
이때, 한 샘플의 평균값을 $X$ 라고 하면, 평균들의 합인 $S_k$ 는
$$ S_{k} = X_1 + X_2 + . . . + X_k $$
와 같다.
이렇게 얻은 샘플들(k 개의)의 평균인 $ A_k $ 는,
$$ A_k = \displaystyle \frac{(X_1 + X_2 + . . . + X_k)}{k} = \frac{S_{k}}{k} $$
라고 할 수 있다.
이때,
$$
\begin{align*}
E[S_k] & = E[X_1 + X_2 + . . . +X_k] \\
& = E[X_1] + E[X_2] + . . . + E[X_k] \\
& = \mu + \mu + . . . + \mu = k * \mu \\
\end{align*}
$$
$$
\begin{align*}
Var[S_k] & = Var[X_1 + X_2 + . . . +X_k] \\
& = Var[X_1] + Var[X_2] + \dots + Var[X_k] \\
& = k * \sigma^2
\end{align*}
$$
이다.
그렇다면, $ A_k $ 에 관한 기대값과 분산값은:
$$
\begin{align*}
E[A_k] & = E[\frac{S_k}{k}] \\
& = \frac{1}{k}*E[S_k] \\
& = \frac{1}{k}*k*\mu = \mu
\end{align*}
$$
이고,
$$
\begin{align*}
Var[A_k] & = Var[\frac{S_k}{k}] \\
& = \frac{1}{k^2} Var[S_k] \\
& = \frac{1}{k^2}*k*\sigma^2 \\
& = \frac{\sigma^2}{k} \nonumber
\end{align*}
$$
라고 할 수 있다.