Differences

This shows you the differences between two versions of the page.

--- variance [2026/03/10 23:44] – hkimscil
+++ variance [2026/03/10 23:56] (current) – hkimscil
@@ Line 1: / Line 1: @@
 ====== Variance ======
 [[Mean]],[[Mode]],[[Median]] 등의 중심경향값과 더불어서 많이 사용되는 [[:Statistics|statistics(통계치)]]로는 데이터가 얼마나 퍼져 있는지 (spread)를 나타내는 것들이 있다. 가장 평이하고 이해하기 쉬운 개념으로는 [[:Range|range(범위)]]가 있으며, 다소 직관적이지는 않지만 여러가지 통계 계산에 사용되는 것으로는 Variance(분산)이 있다.
 <tabbox rs1a>
 <code>
@@ Line 7: / Line 8: @@
 m.x <- 50
 sd.x <- 4
+set.seed(101)
 x <- rnorm2(n.x, m.x, sd.x)
 x[1]
+# x[1] = m.x + e.x
+e.x <- x - m.x
+head(e.x)
+sum(e.x)
+x2 <- m.x + e.x
+x2 == x
+se.x <- e.x^2  # square error
+head(se)
+sse.x <- sum(se)
+###############
+sse.x # sum of square error
+    # (residual, deviation score, total)
+###############
+df.x <- n.x - 1
+mse.x <- sse.x / df.x
+mse.x
+var(x)
+mse.x == var(x)
+############################
 </code>
 <tabbox ro1a>
 <code>
+> rnorm2 <- function(n,mean,sd) { mean+sd*scale(rnorm(n)) }
+> n.x <- 100
+> m.x <- 50
+> sd.x <- 4
+>
+> set.seed(101)
+> x <- rnorm2(n.x, m.x, sd.x)
+> x[1]
+[1] 48.76307
+> # x[1] = m.x + e.x
+> e.x <- x - m.x
+> head(e.x)
+          [,1]
+[1,] -1.236931
+[2,]  2.525088
+[3,] -2.731068
+[4,]  1.077222
+[5,]  1.490081
+[6,]  5.186575
+> sum(e.x)
+[1] 7.105427e-15
+>
+> x2 <- m.x + e.x
+> x2 == x
+       [,1]
+  [1,] TRUE
+  [2,] TRUE
+  [3,] TRUE
+  [4,] TRUE
+  [5,] TRUE
+  [6,] TRUE
+ [10,] TRUE
+ . . . . . .
+ [99,] TRUE
+[100,] TRUE
+>
+> se.x <- e.x^2  # square error
+> head(se)
+          [,1]
+[1,]  2.003177
+[2,] 40.421681
+[3,]  3.024598
+[4,] 15.246176
+[5,]  1.763444
+[6,] 33.997606
+> sse.x <- sum(se)
+> ###############
+> sse.x # sum of square error (residual, deviation score, total)
+[1] 1584
+> ###############
+>
+> df.x <- n.x - 1
+> mse.x <- sse.x / df.x
+> mse.x
+[1] 16
+> var(x)
+     [,1]
+[1,]   16
+> mse.x == var(x)
+     [,1]
+[1,] TRUE
+>
+> ############################
+>
 </code>
 </tabbox>
   * 숫자로 측정된 한 변인이 (variable Y) 있다.
   * 변인 Y는 총 100개의 원소로 구성되어 하나의 샘플이라고 할 수 있다.