correlation

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
correlation [2023/10/05 07:20] – [e.g. 1,] hkimscilcorrelation [2026/05/04 03:07] (current) – [상관관계의 특징] hkimscil
Line 39: Line 39:
 | Medium  | 0.3 ~ 0.5  | -0.3 ~ -0.5  | | Medium  | 0.3 ~ 0.5  | -0.3 ~ -0.5  |
 | Large  | 0.5 ~ 1.0  | -0.5 ~ -1.0  | | Large  | 0.5 ~ 1.0  | -0.5 ~ -1.0  |
-그러나, df를 참조여 correlation coefficient table을 참조하여 판단할 것+그러나, 상관관계의 크기는 샘플 사이즈의 영향을 지대게 받는다. 가령 세개의 데이터 entry가 있는 경우의 correlation값은 그 자체로 상당히 높을 수가 있다. 따라서, df가 작은 경우에 상관관계가 높아야 상관관계로 인정받게 된다.  
 + 
  
 ===== 상관관계가 사용되기 위한 조건 ===== ===== 상관관계가 사용되기 위한 조건 =====
Line 154: Line 156:
 \end{eqnarray} \end{eqnarray}
  
-----+<WRAP box>
 그런데 왜 다음과 같은 공식인지는  그런데 왜 다음과 같은 공식인지는 
 \begin{align} \begin{align}
Line 167: Line 169:
 & \text{is n instead of n-1} \nonumber \\ & \text{is n instead of n-1} \nonumber \\
 & \text{And we also know that} \nonumber \\ & \text{And we also know that} \nonumber \\
-Var[X] & = E[X^2] − (E[X])^2 \;\; \text{see} \ref{expected_value_and_variance_properties#mjx-eqn-var.theorem.1} \nonumber \\+Var[X] & = E[X^2] − (E[X])^2 \;\; \nonumber \\
 & = \frac {\Sigma {X^2}}{n} - \left(\frac{\Sigma{X}}{n} \right)^2 \nonumber \\ & = \frac {\Sigma {X^2}}{n} - \left(\frac{\Sigma{X}}{n} \right)^2 \nonumber \\
 & = \frac {\Sigma {X^2}}{n} - \frac{(\Sigma{X})^2}{n^2} \nonumber \\ & = \frac {\Sigma {X^2}}{n} - \frac{(\Sigma{X})^2}{n^2} \nonumber \\
Line 173: Line 175:
 SS_{\small{X}} & = \Sigma {X^2} - \frac{(\Sigma{X})^2}{n}  \;\;\;\;\; \text{That is,  } \; \ref{ss.simplified} \nonumber \\ SS_{\small{X}} & = \Sigma {X^2} - \frac{(\Sigma{X})^2}{n}  \;\;\;\;\; \text{That is,  } \; \ref{ss.simplified} \nonumber \\
 \end{align} \end{align}
 +</WRAP>
 +
 +<WRAP box>
 +또한 
 +\begin{align}
 +SP & = & \sum XY - \frac{\sum X \sum Y}{n} \label{sp.simplified} \tag{SP simplified} \\
 +\end{align}
 +
 +
 +\begin{align}
 +Cov[X,Y] & = E[(X-\overline{X})(Y-\overline{Y})] \nonumber \\
 + & = E[XY - X \overline{Y} - \overline{X} Y - \overline{X} \overline{Y}] \nonumber \\
 + & = E[XY] - E[X] \overline{Y} - \overline{X} E[Y] + \overline{X} \overline{Y} \nonumber \\
 + & \because \;\;\; E[c] = c \;\;\; \text{and, }  \overline{X} = E[X] \nonumber \\
 + & =  E[XY] - E[X]E[Y] - E[X]E[Y] + E[X]E[Y] \nonumber \\
 + & =  E[XY] - E[X]E[Y] \nonumber \\
 + & =  \frac{\Sigma{XY}}{n} - \frac{\Sigma{X}}{n} \frac{\Sigma{Y}}{n}  \nonumber \\
 + & \therefore  \nonumber \\
 +SP & = \Sigma{XY} - \frac{\Sigma{X} \Sigma{Y}}{n}  \;\;\;\;\; \text{That is,  } \; \ref{sp.simplified} \nonumber \\
 +
 +\end{align}
 +</WRAP>
  
 이제 r (correlation coefficient) 값은: 이제 r (correlation coefficient) 값은:
correlation.1696490421.txt.gz · Last modified: by hkimscil

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki