c:ms:2023:w07_anova_note
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
c:ms:2023:w07_anova_note [2023/04/18 22:26] – [R square or Eta] hkimscil | c:ms:2023:w07_anova_note [2023/06/04 21:38] (current) – [Post hoc test] hkimscil | ||
---|---|---|---|
Line 125: | Line 125: | ||
</ | </ | ||
- | ====== Output | + | |
+ | ===== ANOVA in R: Output ===== | ||
< | < | ||
> # | > # | ||
Line 417: | Line 418: | ||
> | > | ||
</ | </ | ||
- | ====== R square or Eta ====== | ||
- | SS toal | ||
- | * = Y 변인만으로 Y를 예측했을 때의 오차의 제곱 | ||
- | * Y 변인만으로 = Y의 평균을 가지고 Y값을 예측한 것 | ||
- | * 학습 초기에 에러의 제곱의 합으로 설명된 것 | ||
- | SS between | + | ====== Post hoc test ====== |
- | * X 변인 (independent variable) 정보가 고려 되었을 때 | + | |
- | * 독립변인이 고려되었을 때 (됨으로써) | + | |
- | * 없어지는 SS total의 불확실 성 | + | |
- | * 혹은 획득되는 <fc # | + | |
- | + | ||
- | SS error | + | |
- | * IV가 고려되었음에도 불구하고 | + | |
- | * 끝까지 남는 error | + | |
- | + | ||
- | SS total = SS between + SS within | + | |
- | + | ||
- | SS between / SS total = IV 가 kicked in 되었을 때 없어지는 uncertainty = IV 의 설명력 = <fc # | + | |
- | + | ||
- | 즉, IV로 uncertainty 가 얼마나 없어질까? | + | |
- | + | ||
- | 이를 살펴보기 위해 | + | |
- | + | ||
- | < | + | |
- | ss.tot | + | |
- | ss.bet | + | |
- | r.sq <- ss.bet / ss.tot | + | |
- | r.sq | + | |
- | + | ||
- | # then . . . . | + | |
- | + | ||
- | lm.res <- lm(values ~ group, data = comb3) | + | |
- | summary(lm.res) | + | |
- | anova(lm.res) | + | |
- | </ | + | |
- | output | + | |
- | + | ||
- | < | + | |
- | > ss.tot | + | |
- | [1] 2666 | + | |
- | > ss.bet | + | |
- | [1] 416 | + | |
- | > r.sq <- ss.bet / ss.tot | + | |
- | > r.sq | + | |
- | [1] 0.156039 | + | |
- | > | + | |
- | > # then . . . . | + | |
- | > | + | |
- | > lm.res <- lm(values ~ group, data = comb3) | + | |
- | > summary(lm.res) | + | |
- | + | ||
- | Call: | + | |
- | lm(formula = values ~ group, data = comb3) | + | |
- | + | ||
- | Residuals: | + | |
- | Min 1Q Median | + | |
- | -16.020 | + | |
- | + | ||
- | Coefficients: | + | |
- | Estimate Std. Error t value Pr(> | + | |
- | (Intercept) | + | |
- | groupb | + | |
- | groupc | + | |
- | --- | + | |
- | Signif. codes: | + | |
- | + | ||
- | Residual standard error: 7.071 on 45 degrees of freedom | + | |
- | Multiple R-squared: | + | |
- | F-statistic: | + | |
- | + | ||
- | > anova(lm.res) | + | |
- | Analysis of Variance Table | + | |
- | + | ||
- | Response: values | + | |
- | Df Sum Sq Mean Sq F value Pr(> | + | |
- | group 2 416 | + | |
- | Residuals 45 | + | |
- | --- | + | |
- | Signif. codes: | + | |
- | > | + | |
- | > | + | |
- | </ | + | |
- | ====== Post hoc ====== | + | |
[[:post hoc test]] | [[:post hoc test]] | ||
< | < | ||
Line 515: | Line 434: | ||
d.bc | d.bc | ||
- | # se | + | # mse (ms within) |
- | # from the a.res.sum output | + | # a.res.sum == summary(aov(values ~ group, data=comb3)) |
a.res.sum | a.res.sum | ||
# mse = 50 | # mse = 50 | ||
mse <- 50 | mse <- 50 | ||
+ | # 혹은 fansy way from comb3 data.frame | ||
+ | # 15 는 각 그룹의 df | ||
+ | sse.ch <- sum(tapply(comb3$values, | ||
+ | sse.ch | ||
+ | mse.ch <- sse.ch/45 | ||
+ | mse.ch | ||
se <- sqrt(mse/ | se <- sqrt(mse/ | ||
Line 548: | Line 473: | ||
TukeyHSD(a.res, | TukeyHSD(a.res, | ||
</ | </ | ||
- | output | ||
+ | < | ||
+ | plot(TukeyHSD(a.res, | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | pairwise.t.test(comb3$values, | ||
+ | </ | ||
+ | ===== post hoc test: output ===== | ||
< | < | ||
> m.a | > m.a | ||
Line 625: | Line 557: | ||
</ | </ | ||
+ | |||
+ | {{: | ||
+ | ====== R square or Eta square ====== | ||
+ | SS toal | ||
+ | * = Y 변인만으로 Y를 예측했을 때의 오차의 제곱 | ||
+ | * Y 변인만으로 = Y의 평균을 가지고 Y값을 예측한 것 | ||
+ | * 학습 초기에 에러의 제곱의 합으로 설명된 것 | ||
+ | |||
+ | SS between | ||
+ | * X 변인 (independent variable) 정보가 고려 되었을 때 | ||
+ | * 독립변인이 고려되었을 때 (됨으로써) | ||
+ | * 없어지는 SS total의 불확실 성 | ||
+ | * 혹은 획득되는 <fc # | ||
+ | |||
+ | SS error | ||
+ | * IV가 고려되었음에도 불구하고 | ||
+ | * 끝까지 남는 error | ||
+ | |||
+ | SS total = SS between + SS within | ||
+ | |||
+ | SS between / SS total = IV 가 kicked in 되었을 때 없어지는 uncertainty = IV 의 설명력 = <fc # | ||
+ | |||
+ | 즉, IV로 uncertainty 가 얼마나 없어질까? | ||
+ | |||
+ | 이를 살펴보기 위해 | ||
+ | |||
+ | < | ||
+ | ss.tot | ||
+ | ss.bet | ||
+ | r.sq <- ss.bet / ss.tot | ||
+ | r.sq | ||
+ | |||
+ | # then . . . . | ||
+ | |||
+ | lm.res <- lm(values ~ group, data = comb3) | ||
+ | summary(lm.res) | ||
+ | anova(lm.res) | ||
+ | </ | ||
+ | |||
+ | ===== R square: output ===== | ||
+ | < | ||
+ | > ss.tot | ||
+ | [1] 2666 | ||
+ | > ss.bet | ||
+ | [1] 416 | ||
+ | > r.sq <- ss.bet / ss.tot | ||
+ | > r.sq | ||
+ | [1] 0.156039 | ||
+ | > | ||
+ | > # then . . . . | ||
+ | > | ||
+ | > lm.res <- lm(values ~ group, data = comb3) | ||
+ | > summary(lm.res) | ||
+ | |||
+ | Call: | ||
+ | lm(formula = values ~ group, data = comb3) | ||
+ | |||
+ | Residuals: | ||
+ | Min 1Q Median | ||
+ | -16.020 | ||
+ | |||
+ | Coefficients: | ||
+ | Estimate Std. Error t value Pr(> | ||
+ | (Intercept) | ||
+ | groupb | ||
+ | groupc | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | |||
+ | Residual standard error: 7.071 on 45 degrees of freedom | ||
+ | Multiple R-squared: | ||
+ | F-statistic: | ||
+ | |||
+ | > anova(lm.res) | ||
+ | Analysis of Variance Table | ||
+ | |||
+ | Response: values | ||
+ | Df Sum Sq Mean Sq F value Pr(> | ||
+ | group 2 416 | ||
+ | Residuals 45 | ||
+ | --- | ||
+ | Signif. codes: | ||
+ | > | ||
+ | > | ||
+ | </ | ||
+ |
c/ms/2023/w07_anova_note.1681824399.txt.gz · Last modified: 2023/04/18 22:26 by hkimscil