anova
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
anova [2020/05/20 15:13] – [Example] hkimscil | anova [2022/09/30 09:02] (current) – [SS within] hkimscil | ||
---|---|---|---|
Line 189: | Line 189: | ||
$$ | $$ | ||
- | \text{SS} | + | \text{SS} = \sum X_i^2 - \frac{(\sum {X_i)^2}}{n} |
$$ | $$ | ||
==== SS within ==== | ==== SS within ==== | ||
두 번째로 알아봐야 할 것은 각각의 그룹 내에서 그룹 멤버들이 평균에서 얼마나 흩어져 있는가이다. 이 분산값은 이전에 소개된 분산값의 공식을 이용해서 구할 수 있다. 단, 여기서 비교하는 그룹이 세 개이므로 SS 값은 모두 3개를 구할 수 있으므로, | 두 번째로 알아봐야 할 것은 각각의 그룹 내에서 그룹 멤버들이 평균에서 얼마나 흩어져 있는가이다. 이 분산값은 이전에 소개된 분산값의 공식을 이용해서 구할 수 있다. 단, 여기서 비교하는 그룹이 세 개이므로 SS 값은 모두 3개를 구할 수 있으므로, | ||
- | $$ | + | $$ SS_{within} = \sum {SS_{each group}} $$ |
- | SS_{within}} = \sum {SS_{each group} | + | |
- | $$ | + | |
위에서 각각의 SS값은 미리 구해 두었으므로, | 위에서 각각의 SS값은 미리 구해 두었으므로, | ||
$$ | $$ | ||
- | SS_{within} | + | SS_{within} = 6 + 4 + 6 = 16 |
$$ | $$ | ||
Line 375: | Line 373: | ||
====== Post hoc test ====== | ====== Post hoc test ====== | ||
[[Post hoc test]] | [[Post hoc test]] | ||
- | < | + | < |
> adata | > adata | ||
Brands | Brands | ||
Line 474: | Line 472: | ||
====== F and t value ====== | ====== F and t value ====== | ||
$$ F = t^{2}$$ | $$ F = t^{2}$$ | ||
- | < | + | < |
> head(td) | > head(td) | ||
gender tmobconv out in. mobpeo | gender tmobconv out in. mobpeo | ||
Line 518: | Line 516: | ||
====== Example ====== | ====== Example ====== | ||
+ | 가설. 단어맞히기 게임에서 첫글자를 힌트로 주거나, 마지막 글자를 힌트로 주거나, 힌트를 주지 않은 세 그룹 간에 틀린 단어의 숫자에 차이가 있을 것이다. | ||
+ | |||
+ | [[anova/ | ||
+ | |||
| |First Letter \\ Condition 1 \\ X< | | |First Letter \\ Condition 1 \\ X< | ||
| | 15 | 21 | 28 | | | | 15 | 21 | 28 | | ||
Line 536: | Line 538: | ||
| a = $\sum{(X_i)^2}$ | | a = $\sum{(X_i)^2}$ | ||
| a-b = Var.within | | a-b = Var.within | ||
+ | |||
\begin{eqnarray*} | \begin{eqnarray*} | ||
a & = & \sum (X_i)^2 = 17370 \\ | a & = & \sum (X_i)^2 = 17370 \\ | ||
Line 545: | Line 548: | ||
g & = & SS_{between} = e - f = 420 | g & = & SS_{between} = e - f = 420 | ||
\end{eqnarray*} | \end{eqnarray*} | ||
+ | |||
+ | | m.total = Mean.total | ||
+ | | m.within = Mean.each.group | ||
+ | | o = m.total - m.within | ||
+ | | o%%^%%2 | ||
+ | | n | 10 | 10 | 10 | | ||
+ | | o%%^%%2 * n | 250 | 10 | 160 | | ||
+ | | sum | $g = \; $ 420 ||| | ||
+ | |||
\begin{eqnarray*} | \begin{eqnarray*} | ||
- | k = 3 \\ | + | k & = & 3 \\ |
- | n = 10 \\ | + | n & = & 10 \\ |
- | N = 30 \\ | + | N & = & 30 \\ |
\end{eqnarray*} | \end{eqnarray*} | ||
\begin{eqnarray*} | \begin{eqnarray*} | ||
- | df_{between} = \\ | + | e' & = & df_{between} = \\ |
- | df_{within} = \\ | + | f' & = & df_{within} = |
- | df_{total} = \\ | + | g' & = & df_{total} = \\ |
\end{eqnarray*} | \end{eqnarray*} | ||
- | < | + | | | SS | df | MS | F | |
+ | | between | ||
+ | | within | ||
+ | | total | $g = \;$ 1500 | $g' = \;$ 29 | | ||
+ | |||
+ | F< | ||
+ | F< | ||
+ | |||
+ | F< | ||
+ | ====== Example 2 ====== | ||
+ | < | ||
+ | x1 <- c(15, 20, 14, 13, 18, 16, 13, 12, 18, 41) | ||
x2 <- c(21, 25, 29, 18, 26, 22, 26, 24, 28, 21) | x2 <- c(21, 25, 29, 18, 26, 22, 26, 24, 28, 21) | ||
x3 <- c(28, 30, 32, 28, 26, 30, 25, 36, 20, 15) | x3 <- c(28, 30, 32, 28, 26, 30, 25, 36, 20, 15) | ||
</ | </ | ||
- | < | + | < |
x1 x2 x3 | x1 x2 x3 | ||
1 15 21 28 | 1 15 21 28 | ||
Line 612: | Line 635: | ||
< | < | ||
- | > colnames(xs[1]) <- " | + | > colnames(xs) |
- | > colnames(xs[2]) <- "cond" | + | |
</ | </ | ||
- | < | + | < |
+ | # cf | ||
# lengthofelements <- length(x1) | # lengthofelements <- length(x1) | ||
# varofvariable <- var(x1)</ | # varofvariable <- var(x1)</ | ||
< | < | ||
- | df_x1 | + | df.total <- length(xs$wrong) - 1 |
- | df_x2 | + | ss.total <- var(xs$wrong)*df_tot |
- | df_x3 | + | var.total <- ss.total/ |
+ | var.total.r <- var(xs$wrong) | ||
- | ss_x1 | + | df.x1 <- length(x1)-1 |
- | ss_x2 | + | df.x2 <- length(x2)-1 |
- | ss_x3 | + | df.x3 <- length(x3)-1 |
+ | ss.x1 <- var(x1)*df.x1 | ||
+ | ss.x2 <- var(x2)*df.x2 | ||
+ | ss.x3 <- var(x3)*df.x3 | ||
- | df_bet | + | ss.within <- ss.x1 + ss.x2 + ss.x3 |
- | ss_bet | + | df.within <- df.x1 + df.x2 + df.x3 |
+ | ss.between <- ss.total - ss.within | ||
+ | df.between <- df.total - df.within | ||
- | df_tot | + | ms.between <- ss.between/ |
- | ss_tot | + | ms.within <- ss.within/ |
+ | f.value <- ms.between/ | ||
- | df_with | + | ss.between |
- | ss_with | + | df.between |
- | df_bet | + | ss.within |
- | ss_bet | + | df.within |
- | </ | + | ms.between |
+ | ms.within | ||
- | < | + | f.value |
- | df_tot <- length(xs$ind) - 1 | + | [1] 5.25 |
- | ss_tot | + | |
- | var_tot <- var(xs$values) | + | f.crit |
+ | f.crit | ||
+ | [1] 3.354131 | ||
+ | |||
+ | #################################### | ||
+ | ## f.value가 f.crit 값보다 크므로 | ||
+ | ## 세 그룹 간에 차이가 있다는 가설을 | ||
+ | ## 받아들인다. | ||
+ | ## 없다는 영가설을 부정한다) | ||
+ | #################################### | ||
- | df_x1 <- length(x1)-1 | ||
- | df_x2 <- length(x2)-1 | ||
- | df_x3 <- length(x3)-1 | ||
- | ss_x1 <- var(x1)*df_x1 | ||
- | ss_x2 <- var(x2)*df_x2 | ||
- | ss_x3 <- var(x3)*df_x3 | ||
</ | </ | ||
====== E.G. 1 (R) ====== | ====== E.G. 1 (R) ====== |
anova.1589955224.txt.gz · Last modified: 2020/05/20 15:13 by hkimscil