c:ms:2026:lecture_note_week_04
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| c:ms:2026:lecture_note_week_04 [2026/03/31 16:13] – [Recap] hkimscil | c:ms:2026:lecture_note_week_04 [2026/03/31 22:28] (current) – hkimscil | ||
|---|---|---|---|
| Line 46: | Line 46: | ||
| </ | </ | ||
| - | ====== Recap ====== | ||
| - | Distribution of Sample Means -- mu = 40, sigma = 4 (hence var = 16) 인 모집단에서 n = n 사이즈의 샘플링을 무한 반복할 때 그 샘플평균들이 모인 집합 | ||
| - | <tabbox rscript01> | ||
| - | < | ||
| - | rm(list=ls()) | ||
| - | rnorm2 <- function(n, | ||
| - | mean+sd*scale(rnorm(n)) | ||
| - | } | ||
| - | ss <- function(x) { | ||
| - | sum((x-mean(x))^2) | ||
| - | } | ||
| - | mu <- 40 | ||
| - | sigma <- 4 | ||
| - | iter <- 1000000 | ||
| - | sz <- 16 | ||
| - | se <- sigma/ | ||
| - | ################################ | ||
| - | means <- rnorm2(iter, | ||
| - | hist(means, breaks=50, | ||
| - | xlim = c(mu-6*se, mu+6*se), | ||
| - | main = paste(" | ||
| - | abline(v=mu, | ||
| - | lo1 <- mu - se*1 | ||
| - | hi1 <- mu + se*1 | ||
| - | lo2 <- mu - se*2 | ||
| - | hi2 <- mu + se*2 | ||
| - | lo3 <- mu - se*3 | ||
| - | hi3 <- mu + se*3 | ||
| - | |||
| - | abline(v=c(lo1, | ||
| - | | ||
| - | | ||
| - | |||
| - | print(c(lo2, | ||
| - | |||
| - | m.samp <- 37 | ||
| - | p.val <- pnorm(m.samp, | ||
| - | p.val | ||
| - | z.cal <- (m.samp-mu)/ | ||
| - | z.cal | ||
| - | p.val <- pnorm(z.cal)*2 | ||
| - | p.val | ||
| - | |||
| - | zmeans <- scale(means) | ||
| - | hist(zmeans, | ||
| - | xlim = c(0-10*1, 0+10*1), | ||
| - | | ||
| - | abline(v=0, col=" | ||
| - | abline(v=z.cal, | ||
| - | abline(v=-z.cal, | ||
| - | text(x=-6, y=50000, | ||
| - | | ||
| - | pos = 1, | ||
| - | | ||
| - | text(x=4, y=50000, | ||
| - | | ||
| - | | ||
| - | | ||
| - | text(x=-6, y=30000, | ||
| - | | ||
| - | | ||
| - | pos = 1, | ||
| - | | ||
| - | |||
| - | hist(zmeans, | ||
| - | xlim = c(0-10*1, 0+10*1), | ||
| - | | ||
| - | abline(v=0, col=" | ||
| - | abline(v=c(-1, | ||
| - | | ||
| - | |||
| - | z.cal | ||
| - | p.val | ||
| - | ##### | ||
| - | # 위의 아이디어로는 z.cal 점수가 | ||
| - | # +-2 밖에 있는지 보면 된다. 즉, | ||
| - | # 이는 prob가 0.05보다 작은지 | ||
| - | # 보면 되는 것이다. | ||
| - | ##### | ||
| - | # +-2 는 정확한 숫자가 아니고 | ||
| - | # qnorm(.05/ | ||
| - | # 가 정확한 숫자 | ||
| - | two.minus.exact <- qnorm(.05/ | ||
| - | two.plus.exact <- qnorm(1-(.05/ | ||
| - | c(two.minus.exact, | ||
| - | ##### | ||
| - | # 그러나 R 사용시에는 z 점수로 | ||
| - | # 판단하기 보다는 | ||
| - | # 직접 구하는 prob.로 판단 | ||
| - | pnorm(z.cal)*2 | ||
| - | p.val | ||
| - | ##### | ||
| - | # 위에서 그룹 간의 차이를 | ||
| - | # standard error로 나누는 것에 주의 | ||
| - | # | ||
| - | |||
| - | |||
| - | ################ | ||
| - | m.samp <- 43 | ||
| - | sd.samp <- 4 | ||
| - | sz <- 16 | ||
| - | samp <- rnorm2(sz, m.samp, sd.samp) | ||
| - | diff <- m.samp - mu | ||
| - | se <- sd.samp / sqrt(sz) | ||
| - | t.cal <- diff/se | ||
| - | df <- sz-1 | ||
| - | p.val <- pt(t.cal, df=df, lower.tail = F)*2 | ||
| - | t.cal | ||
| - | df | ||
| - | p.val | ||
| - | t.test(samp, | ||
| - | |||
| - | ##### | ||
| - | # | ||
| - | m.a <- 5.8 | ||
| - | m.b <- 6.3 | ||
| - | sd.a <- .5 | ||
| - | sd.b <- .5 | ||
| - | sz.a <- 16 | ||
| - | sz.b <- 16 | ||
| - | df.a <- sz.a-1 | ||
| - | df.b <- sz.b-1 | ||
| - | df <- df.a + df.b | ||
| - | a <- rnorm2(sz.a, | ||
| - | b <- rnorm2(sz.b, | ||
| - | diff <- m.a - m.b | ||
| - | pv <- (ss(a)+ss(b))/ | ||
| - | se <- sqrt(pv/ | ||
| - | t.cal <- diff / se | ||
| - | p.val <- pt(t.cal, df=df)*2 | ||
| - | |||
| - | diff | ||
| - | se | ||
| - | t.cal | ||
| - | df | ||
| - | p.val | ||
| - | t.test(a,b, var.equal = T) | ||
| - | diff - se*2 | ||
| - | diff + se*2 | ||
| - | lo <- qt(.05/ | ||
| - | lo | ||
| - | hi <- -lo | ||
| - | diff + se*lo | ||
| - | diff + se*hi | ||
| - | |||
| - | </ | ||
| - | <tabbox out01> | ||
| - | < | ||
| - | </ | ||
| - | </ | ||
c/ms/2026/lecture_note_week_04.1774973602.txt.gz · Last modified: by hkimscil
