b:head_first_statistics:using_hypothesis_tests
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
b:head_first_statistics:using_hypothesis_tests [2019/12/12 08:31] – [Step 1: Decide on the hypothesis] hkimscil | b:head_first_statistics:using_hypothesis_tests [2024/11/27 08:30] (current) – [What if the sample size gets larger] hkimscil | ||
---|---|---|---|
Line 38: | Line 38: | ||
{{: | {{: | ||
+ | 위의 그림에서: | ||
+ | 즉, 어느 지점에서 제약회사의 주장을 기각해야 할까? | ||
+ | |||
+ | 유의수준을 (confidence interval) 정하여 기각할 지점을 찾는다. | ||
+ | |||
+ | 이를 5%로 정하면 (혹은 95%) -- | ||
+ | |||
+ | 이번에 구한 치료된 11명이 이 5%에 해당되는 숫자인지 아니면 95%에 해당되는 숫자인지 본다. | ||
< | < | ||
xp <- c(1:30) | xp <- c(1:30) | ||
plot(dbinom(xp, | plot(dbinom(xp, | ||
</ | </ | ||
+ | {{: | ||
To find the critical region, first decide on the __significance level__ | To find the critical region, first decide on the __significance level__ | ||
Line 58: | Line 67: | ||
$X \sim B(15, 0.9)$ 에서 $P(X \le 11)$은 무엇인지를 본다. | $X \sim B(15, 0.9)$ 에서 $P(X \le 11)$은 무엇인지를 본다. | ||
< | < | ||
- | pnorm(11, 15, 0.9) | + | pbinom(11, 15, 0.9) |
</ | </ | ||
Line 70: | Line 79: | ||
We accept the claims of the drug company | We accept the claims of the drug company | ||
+ | < | ||
+ | > ############ | ||
+ | > pbinom(11, 15, .9) # 11명 이하로 나은 수 있는 확률은 | ||
+ | [1] 0.05555563 | ||
+ | > pbinom(10, 15, .9) | ||
+ | # 10명 이하라고 하면 그 때의 확률은 0.05보다 | ||
+ | # 작은 0.012 이고, 이것의 의미는 사건이 일어날 | ||
+ | # 확률이 (나을 확률이) 일어나기 극히 어려운 경우 | ||
+ | # 임을 말한다 (1/20보다 작은 확률이라는 뜻) | ||
+ | [1] 0.01272048 | ||
+ | > | ||
+ | </ | ||
====== What if the sample size gets larger ====== | ====== What if the sample size gets larger ====== | ||
| Cured? | | Cured? | ||
Line 79: | Line 100: | ||
이 때의 Distribution은 Binomial이므로 | 이 때의 Distribution은 Binomial이므로 | ||
$X \sim B(100, 0.9)$ 를 따를 것이고, 이 때의 $P(X \le 80)$ 경우를 살펴보고 이것이 critical value (alpha)인 .05를 기준으로 어디에 위치하는지를 살펴본다. | $X \sim B(100, 0.9)$ 를 따를 것이고, 이 때의 $P(X \le 80)$ 경우를 살펴보고 이것이 critical value (alpha)인 .05를 기준으로 어디에 위치하는지를 살펴본다. | ||
- | |||
- | 그런데, 위를 손으로 계산하는 것은 무리이다. 참고로 R에서는 | ||
- | |||
- | <WRAP info> | ||
- | < | ||
- | > pbinom(80, | ||
- | [1] 0.001978561 | ||
- | </ | ||
- | </ | ||
- | |||
* np > 5, nq > 5, 인 경우에 해당하므로 | * np > 5, nq > 5, 인 경우에 해당하므로 | ||
Line 96: | Line 107: | ||
* 또한 샘플의 크기가 비교적 작다면 t-distribution을 상정하고 그 값을 구한다. | * 또한 샘플의 크기가 비교적 작다면 t-distribution을 상정하고 그 값을 구한다. | ||
- | $X ~ N(90, np)$ | + | $X \sim B (100, .9)$ 에서, |
- | $X ~ N(90, 9)$ | + | 따라서, $E(X) = 90$, $V(X) = 9$ 이므로 |
- | X =80 일 때의 Z score는 | + | |
+ | $X \sim B (100, .9)$ 는 $X \sim N(np, npq)$, 즉, $X \sim N(90, 9)$ 를 따르는 분포를 보일 것이다. | ||
+ | X = 80 이었으므로 이 지점의 Z score는 | ||
\begin{eqnarray*} | \begin{eqnarray*} | ||
z & = & \dfrac{X-90}{sd} \\ | z & = & \dfrac{X-90}{sd} \\ | ||
Line 111: | Line 124: | ||
z = -3.33 일 때의 Probability는 .0004이다. 이는 .05보다 훨씬 바깥 쪽에 위치하므로 | z = -3.33 일 때의 Probability는 .0004이다. 이는 .05보다 훨씬 바깥 쪽에 위치하므로 | ||
Null hypothesis를 부정한다. | Null hypothesis를 부정한다. | ||
+ | < | ||
+ | > pnorm(-3.33, | ||
+ | [1] 0.0004342299 | ||
+ | # 혹은 | ||
+ | > pnorm(80, 90, 3) | ||
+ | [1] 0.0004290603 | ||
+ | </ | ||
- | 즉, 회사의 | + | 그런데 보통은 (r을 사용하지 않을 경우에는) 위와 같은 계산이 어려우므로, |
+ | z 점수가 .05일 경우의 점수를 찾아 본다. | ||
+ | < | ||
+ | > qnorm(0.05, 0, 1) # 왼쪽 부분 5%에 해당하는 z 값 | ||
+ | [1] -1.644854 | ||
+ | > # 혹은 원점수로 살펴보면 | ||
+ | > qnorm(0.05, 90, 3) # 왼쪽 부분 5%에 해당하는 원점수 값 | ||
+ | [1] 85.06544 | ||
+ | </ | ||
+ | 이 때의 z 값은 -1.64 이므로 | ||
+ | * 이 점수와 -3.33 을 비교한다. | ||
+ | * 혹은 85.06544 를 80 점과 비교한다. | ||
+ | < | ||
+ | |||
+ | 다른 예: [[: | ||
+ | <WRAP box 60%> | ||
+ | 연구자는 조사방법론 수업을 듣는 전체 모집단 학생들의 평균(이런 종류의 테스트가 있다고 가정)이 얼마인지를 알고 있다(평균 = 50, stdev = 10). | ||
+ | |||
+ | 연구자는 wiki를 사용하여 한 학기의 수업을 한 후에 같은 종류의 테스트를 wiki사용자들에게 하여, 이들의 평균이 wiki를 사용하지 않는 평범한 학생들의 성적과 차이가 있음을 밝힌다면, | ||
+ | </ | ||
====== Error types ====== | ====== Error types ====== | ||
[[:Types of error]] | [[:Types of error]] | ||
b/head_first_statistics/using_hypothesis_tests.1576107075.txt.gz · Last modified: 2019/12/12 08:31 by hkimscil