User Tools

Site Tools


b:head_first_statistics:using_hypothesis_tests

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
b:head_first_statistics:using_hypothesis_tests [2024/11/20 11:38] – [What if the sample size gets larger] hkimscilb:head_first_statistics:using_hypothesis_tests [2024/11/27 08:30] (current) – [What if the sample size gets larger] hkimscil
Line 92: Line 92:
 </code> </code>
 ====== What if the sample size gets larger ====== ====== What if the sample size gets larger ======
-| Cured?  | yes  | no  | 
-| Freq  | 110  | 40  | 
- 
-Null H : P = 0.9 
-Alt H: P < 0.9 
- 
-<code> 
-xp <- c(1:300) 
-plot(dbinom(xp, 150, .9), type = "hist", main = "X ~ B(150, .9)") 
-</code> 
- 
-{{:b:head_first_statistics:pasted:20191212-081524.png}} 
- 
- 
-<code> 
-pbinom(110, 150, .9) 
-</code> 
- 
-<code> 
-> pbinom(110, 150, .9) 
-[1] 5.785159e-09 
-</code> 
- 
-textbook ---- 
 | Cured?  | yes  | no  | | Cured?  | yes  | no  |
 | Freq  | 80  | 20  | | Freq  | 80  | 20  |
Line 135: Line 111:
  
 $X \sim B (100, .9)$ 는 $X \sim N(np, npq)$, 즉, $X \sim N(90, 9)$ 를 따르는 분포를 보일 것이다.  $X \sim B (100, .9)$ 는 $X \sim N(np, npq)$, 즉, $X \sim N(90, 9)$ 를 따르는 분포를 보일 것이다. 
-그런데, n=100의 샘플평균들의 분포는 $X \sim N(90, 9/100)$ 이고 이때 se = 0.3 이다.  
-이 때 
 X = 80 이었으므로 이 지점의 Z score는  X = 80 이었으므로 이 지점의 Z score는 
 \begin{eqnarray*} \begin{eqnarray*}
 z & = & \dfrac{X-90}{sd} \\ z & = & \dfrac{X-90}{sd} \\
-& = & \dfrac{80-90}{0.3} \\ +& = & \dfrac{80-90}{3} \\ 
-& = & -0.333 \\+& = & -3.33 \\
 \end{eqnarray*} \end{eqnarray*}
  
Line 153: Line 127:
 > pnorm(-3.33, 0, 1) > pnorm(-3.33, 0, 1)
 [1] 0.0004342299 [1] 0.0004342299
 +# 혹은 
 +> pnorm(80, 90, 3)
 +[1] 0.0004290603
 </code> </code>
  
 그런데 보통은 (r을 사용하지 않을 경우에는) 위와 같은 계산이 어려우므로,  그런데 보통은 (r을 사용하지 않을 경우에는) 위와 같은 계산이 어려우므로, 
-z 점수가 .05일 경우의 점수를 찾아 본다 ([[:z-table]]에서). 이 때의 z 값은 -1.64 이므로 이 점수와 -3.33을 비교한다. 위의 그림처럼 -3.33은 영가설 기각기준 왼 쪽에 존재하므로 영가설을 부정 혹은 기각한다. +z 점수가 .05일 경우의 점수를 찾아 본다. 이는 [[:z-table]]에서 찾아보거나 R에서 찾아 볼 수 있다.  
 +<code> 
 +> qnorm(0.05, 0, 1# 왼쪽 부분 5%에 해당하는 z 값 
 +[1] -1.644854 
 +> # 혹은 원점수로 살펴보면 
 +> qnorm(0.05, 90, 3) # 왼쪽 부분 5%에 해당하는 원점수 값 
 +[1] 85.06544 
 +</code> 
 + 
 +이 때의 z 값은 -1.64 이므로  
 +  * 이 점수와 -3.33 을 비교한다.  
 +  * 혹은 85.06544 를 80 점과 비교한다.  
 +<del>위의 그림처럼 -3.33은 영가설 기각기준 왼 쪽에 존재하므로</del> -- > P(X < -1.64) = 0.05 라는 이야기인데, 내가 구한 z 값은 -3.33 이므로 이 0.05 구간 안에 존재한다. 즉, 80점의 평균을 얻을 확률이 아주 낮다는 (1/20보다 낮다는) 이야기이므로 영가설인, 샘플의 평균인 80점이 모집단의 평균에서 나왔다는 것을 (같을 것이라는 것을) 부정한다 (혹은 기각한다). 즉, 회사의 claim 인 90% cure를 받아들이지 못한다. 
  
-즉, 회사의 claim 인 90cure를 받아들이지 못한다. +다른 예: [[:hypothesis testing]] 
 +<WRAP box 60%
 +연구자는 조사방법론 수업을 듣는 전체 모집단 학생의 평균(런 종류의 테스트가 있다고 가정)이 얼마인를 알고 있(평균 = 50, stdev = 10).
  
 +연구자는 wiki를 사용하여 한 학기의 수업을 한 후에 같은 종류의 테스트를 wiki사용자들에게 하여, 이들의 평균이 wiki를 사용하지 않는 평범한 학생들의 성적과 차이가 있음을 밝힌다면, 가설검증이 성공된다.
 +</WRAP>
 ====== Error types ====== ====== Error types ======
 [[:Types of error]] [[:Types of error]]
  
b/head_first_statistics/using_hypothesis_tests.1732070319.txt.gz · Last modified: 2024/11/20 11:38 by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki