b:head_first_statistics:measuring_central_tendency
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
b:head_first_statistics:measuring_central_tendency [2022/09/14 13:10] – [Ugliness of mean and median] hkimscil | b:head_first_statistics:measuring_central_tendency [2024/09/09 09:50] (current) – [mean] hkimscil | ||
---|---|---|---|
Line 21: | Line 21: | ||
이것을 우리는 흔히 " | 이것을 우리는 흔히 " | ||
\begin{equation*} | \begin{equation*} | ||
- | \mu = \frac{\sum\limits_{i=1}^{n} X_i}{n} | + | \mu = \frac{\sum\limits_{i=1}^{N} X_i}{N} |
\end{equation*} | \end{equation*} | ||
Line 31: | Line 31: | ||
\begin{equation*} | \begin{equation*} | ||
\begin{split} | \begin{split} | ||
- | \mu = \frac{\sum\limits_{}^{} \text{fx}}{\sum{\text{f}}} | + | \mu = \frac{\sum\limits_{}^{} \text{fx}}{\sum{\text{f.nothing}}} |
= \frac{1 \text{x} 19 + 3 \text{x} 20 + 1 \text{x} 21}{5} | = \frac{1 \text{x} 19 + 3 \text{x} 20 + 1 \text{x} 21}{5} | ||
\end{split} | \end{split} | ||
Line 43: | Line 43: | ||
===== skewedness ===== | ===== skewedness ===== | ||
<WRAP info> | <WRAP info> | ||
- | [{{skewedness.jpg}}] | + | skewedness: 왜도 |
+ | {{skewedness.jpg}} | ||
</ | </ | ||
Line 104: | Line 105: | ||
==== e.g. 1 ==== | ==== e.g. 1 ==== | ||
- | quartile 명령어는 r에서는 없다. 대신 quantile을 사용합니다. 둘은 비슷하나 quantile은 4분위 이상의 것을 한다. | + | quartile 명령어는 r에서는 없다. 대신 quantile을 사용한다. 둘은 비슷하나 quantile은 4분위 이상의 것을 한다. |
R에서 | R에서 | ||
Line 202: | Line 203: | ||
> | > | ||
</ | </ | ||
- | |||
- | |||
- | |value | 1 | 4 | 6 | 8 | 9 | 10 | 11 | 12 | | ||
- | |freq | 1 | 1 | 2 | 3 | 4 | 4 | 5 | 5 | | ||
< | < | ||
Line 215: | Line 212: | ||
< | < | ||
{1, 1, 1, 2, 2, 2, 2, 2, 3, 31, 31, 31, 32, 32, 32, 32, 33, 33, 33} | {1, 1, 1, 2, 2, 2, 2, 2, 3, 31, 31, 31, 32, 32, 32, 32, 33, 33, 33} | ||
+ | </ | ||
+ | < | ||
+ | a <- c(1, 1, 1, 2, 2, 2, 2, 3, 3, 31, 31, 32, 32, 32, 32, 33, 33, 33) | ||
+ | b <- c(1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 31, 31, 32, 32, 32, 32, 33, 33, 33) | ||
+ | c <- c(1, 1, 1, 2, 2, 2, 2, 2, 3, 31, 31, 31, 32, 32, 32, 32, 33, 33, 33) | ||
+ | a | ||
+ | b | ||
+ | c | ||
+ | length(a) | ||
+ | length(b) | ||
+ | length(c) | ||
+ | mean(a) | ||
+ | mean(b) | ||
+ | mean(c) | ||
+ | median(a) | ||
+ | median(b) | ||
+ | median(c) | ||
+ | </ | ||
+ | < | ||
+ | # output | ||
+ | > a <- c(1, 1, 1, 2, 2, 2, 2, 3, 3, 31, 31, 32, 32, 32, 32, 33, 33, 33) | ||
+ | > b <- c(1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 31, 31, 32, 32, 32, 32, 33, 33, 33) | ||
+ | > c <- c(1, 1, 1, 2, 2, 2, 2, 2, 3, 31, 31, 31, 32, 32, 32, 32, 33, 33, 33) | ||
+ | > a | ||
+ | | ||
+ | > b | ||
+ | | ||
+ | > c | ||
+ | | ||
+ | > length(a) | ||
+ | [1] 18 | ||
+ | > length(b) | ||
+ | [1] 19 | ||
+ | > length(c) | ||
+ | [1] 19 | ||
+ | > mean(a) | ||
+ | [1] 17 | ||
+ | > mean(b) | ||
+ | [1] 16.21053 | ||
+ | > mean(c) | ||
+ | [1] 17.68421 | ||
+ | > median(a) | ||
+ | [1] 17 | ||
+ | > median(b) | ||
+ | [1] 3 | ||
+ | > median(c) | ||
+ | [1] 31 | ||
+ | > | ||
</ | </ | ||
Line 222: | Line 267: | ||
< | < | ||
## answer | ## answer | ||
+ | n <- 3+2+2 +3+4+4 | ||
+ | n | ||
+ | mean.duckc <- 17 | ||
+ | median.duckc <- 17 | ||
+ | tot <- mean.duckc * n | ||
+ | # 2 :: 4 인것은 이미 알고 있음 | ||
+ | known.sum <- (1*3)+(2*4)+(3*2)+(31*2) | ||
+ | tot - known.sum | ||
+ | # 227 = (32*4) + (33*3) 이므로 | ||
duckc <- c(1, | duckc <- c(1, | ||
mean(duckc) | mean(duckc) | ||
Line 261: | Line 315: | ||
- 최빈값과 동일한 급여를 받고 있다면 어느쪽 인상을 선호할까요? | - 최빈값과 동일한 급여를 받고 있다면 어느쪽 인상을 선호할까요? | ||
</ | </ | ||
+ | Mean | ||
+ | \begin{eqnarray*} | ||
+ | \mu & = & \frac {\Sigma {X_{i}}} {N} \\ | ||
+ | & = & 50000 \\ | ||
+ | \end{eqnarray*} | ||
+ | \begin{eqnarray*} | ||
+ | \text {2000 raised to the mean} & = & \frac {\sum{(X_{i} + 2000)}} {N} \\ | ||
+ | & = & \frac {\sum{(X_{i})} + \sum{(2000)}} {N} \\ | ||
+ | & = & \frac {\sum{(X_{i})}} {N} + \frac {N * (2000)} {N} \\ | ||
+ | & = & 50000 + 2000 \\ | ||
+ | & = & 52000 | ||
+ | \end{eqnarray*} | ||
+ | Median | ||
+ | 모든 연봉에 2000불을 더하는 것이므로 median 값의 위치는 변하지 않는다. 따라서 | ||
+ | \begin{eqnarray*} | ||
+ | \text{Original Median} (20000) + 2000 & = & 22000 | ||
+ | \end{eqnarray*} | ||
+ | Mode | ||
+ | 모든 연봉에 2000불을 더하는 것이므로 mode 값은 원래 모드값인 10000 불에 2000불을 더한 값이다. 따라서 | ||
+ | \begin{eqnarray*} | ||
+ | \text{Original Mode} (10000) + 2000 & = & 12000 | ||
+ | \end{eqnarray*} | ||
+ | |||
+ | Mean | ||
+ | \begin{eqnarray*} | ||
+ | \text {10% raised to the mean} & = & \frac {\sum{(1.1 * X_{i})}} {N} \\ | ||
+ | & = & \frac {1.1 * \sum{(X_{i})}} {N} \\ | ||
+ | & = & 1.1 * \frac {\sum{(X_{i})}} {N} \\ | ||
+ | & = & 1.1 * 50000 \\ | ||
+ | & = & 55000 | ||
+ | \end{eqnarray*} | ||
+ | Median | ||
+ | 모든 연봉에 10%를 더하는 것이므로 median 값의 위치는 변하지 않는다. 따라서 | ||
+ | \begin{eqnarray*} | ||
+ | \text{Original Median} (20000) * 1.1 & = & 22000 | ||
+ | \end{eqnarray*} | ||
+ | Mode | ||
+ | 모든 연봉에 10%를 더하는 것이므로 mode 값은 원래 모드값인 10000 불에 1.1을 곱한 값이다. 따라서 | ||
+ | \begin{eqnarray*} | ||
+ | \text{Original Mode} (10000) * 1.1 & = & 11000 | ||
+ | \end{eqnarray*} | ||
b/head_first_statistics/measuring_central_tendency.1663128619.txt.gz · Last modified: 2022/09/14 13:10 by hkimscil