====== 미디어 애널리틱스 수업 ======
[[./|Class page]]
Mon Thur 10:30 
Week 01: Sep 1, 4
Week 02: Sep 8, 11
Week 03: Sep 15, 18
Week 04: Sep 22, 25
Week 05: Sep 29, Oct 2
Week 06: Oct 6, 9 
Week 07: Oct 13, 16
Week 08: Oct 20, 23
Week 09: Oct 27, 30
Week 10: Nov 3, 6
Week 11: Nov 10, 13
Week 12: Nov 17, 20
Week 13: Nov 24, 27
Week 14: Dec 1, 4
Week 15: Dec 8, 11
Week 16: Dec 15, 18
 
====== Week01 ======
===== ideas and concepts  =====
  * [[https://www.youtube.com/watch?v=YblmPrNv3sM|Installing R]]
  * [[https://www.youtube.com/watch?v=Gzgk2K8inIQ|R use 1]] 
  * [[https://www.youtube.com/watch?v=zBJfXRlUwdI|R use 2]] 
Using [[:theories]] 
  * [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설|연구문제와 가설]] and 
  * making [[:hypothesis|hypotheses]]
  * {{:the_third_person_effect_sprial_of_silence.pdf|양승찬 논문}}
  * 가설 [[:hypothesis#예1]]
Installing R
Using a data set: mtcars
===== Assignment =====
====== Week02  ======
[[:Note.w02]]
[[:t-test summing up]]
===== Concepts and ideas =====
동영상 시청. 아래 동영상은 교재의 2장 이후를 다루는 내용이면서 계산적인 통계에 대해서 공부하기 위해서 꼭 필요한 내용이므로 숙지하시기 바랍니다. 동영상이 길어서 이 부분은 3주차에도 계속 시청합니다. 
  * [[https://www.youtube.com/watch?v=-q1VZz7PHf8|통계: 개괄적 소개 1]]
  * [[https://www.youtube.com/watch?v=Z7XMMgLLfrQ|통계: 개괄적 소개 2]]
  * [[https://www.youtube.com/watch?v=dQ1CYnuU_6s|통계: 개괄적 소개 3]]
  * [[https://www.youtube.com/watch?v=cpdTptIl3Eg|분산에서 왜 n-1로 나누는가? 1 ]]
  * [[https://www.youtube.com/watch?v=SZwy-cgU40E|분산에서 왜 n-1로 나누는가? 2 ]]
  * [[https://www.youtube.com/watch?v=BUTvS4XVDkg|분산에서 왜 n-1로 나누는가? 3 ]]
  * [[https://www.youtube.com/watch?v=YYWwmHgX4Yc|자유도]] [[:Degrees of Freedom]]
  * [[https://www.youtube.com/watch?v=0O_Dkga0HgA|표준편차]] [[:Standard Deviation]]
  * [[https://www.youtube.com/watch?v=mfImOa3_V1o|표준점수]] [[:Standard Score]]
  * [[:Standard Error]]
  * [[:Hypothesis testing]]
----
  * [[:Research Question]]
  * [[:Hypothesis]]
    * Educated guess (via theories)
    * Difference 
    * Association
    * Variables (vs. ideas, concepts, and constructs)
      * [[:Operationalization]]
      * [[:Variables]], 
        * [[:level of measurement]]
          * [[:level of measurement#Nominal]]
          * [[:level of measurement#Ordinal]]
          * [[:level of measurement#Interval]]
          * [[:level of measurement#Ratio]]
        * [[:Types of Variables]] 
        * see [[http://chohongjoong.com/gnu4/bbs/board.php?bo_table=board02&wr_id=311&sfl=&stx=&sst=wr_datetime&sod=desc&sop=and&page=1|this blog]] written in Korean
          * [[:Independent Variable|IV]] 독립변인
          * [[:Dependent Variable|DV]] 종속변인
          * Control variable 제어변인
          * Mediator (Intervening) variable 매개변인
     * 간단한 예로서의 [[:mean|평균]] (mean)
     * 제곱합 (오차의제곱합, 혹은 이탈의제곱합 혹은 deviation score의제곱합)
     * [[:variance|분산]]
       * 모집단 추정을 위해서 [[:why n-1|n-1 사용을 하는 이유]]
       * [[:degrees of freedom|자유도]]
     * [[:Standard Deviation|표준편차]]
     * [[:z_score]]
     * 샘플평균들의 집합
       * [[:Sampling Distribution]] 혹은 Distribution of Sample Means
       * Standard Deviation of Sample Means
       * [[:Standard Error]], 표준오차
       * Central Limit Theorem ([[:Central Limit Theorem]])
     * 예측에서의 (평균이 어디에서 나올까의 예측) 신뢰구간
     * 검정통계
$$ \text{Inferential Statistics} = \frac {\text{Effects}} {\text{Error}} $$
실제차이를 랜덤차이로 나눈 비율 
{{:c:ma:2022:pasted:20220906-201156.png?340}}
\begin{eqnarray*}
s^2 & = \frac {SS}{df} \\
\sqrt{s^2} & = s 
\end{eqnarray*}
===== Activities =====
Group forming
  * random assignment?
  * voluntary formation?
===== Assignment =====
====== Week03 ======
===== Activities =====
Grouping (꼭 할 것)
===== Concepts and ideas =====
영상
Knowledge to understand hypothesis testing
  * [[https://www.youtube.com/watch?v=gmnes_O8dSM|Sampling distribution]] or Distribution of the sample mean or Distsribution of sample means
    * [[:Sampling distribution]]
  * [[https://www.youtube.com/watch?v=ffnQPTIwryM|Mean and variance of sampling distribution]]
  * [[https://www.youtube.com/watch?v=-FehYptG-tY|Standard error and hypothesis testing]]
    * [[:hypothesis testing]]
[[:t-test]]
  * [[https://www.youtube.com/watch?v=3a_Opcy037k|t-test, 4 kinds of]]
  * [[https://www.youtube.com/watch?v=zHxytKBNloM|types of (hypothesis testing) error]]
  * [[https://www.youtube.com/watch?v=--Omqk9KHbw|t-test in R]]
===== Assignment =====
Group Assignment 
가설 만들어 보기
  * 그룹관심사에 포커스를 맞추어 관련된 가설 만들어 보기 
  * SNS에서의 그룹극화는 (Group Polarization) 어떻게 일어날까?
  * Youtube에서의 콘텐츠노출은 어떻게 극화가 될까?
    * filter bubble: Search engine or curating algorithm leads an individual to intellectual or ideological isolation because they feed them information one would agree. (see https://reutersinstitute.politics.ox.ac.uk/news/truth-behind-filter-bubbles-bursting-some-myths)  
    * 그러나, 검색엔진이나 추천알고리즘이 선택을 정해준다기 보다는 
    * 다양한 내용의 선택에도 자신의 선호경향의 내용만을 선택하기 때문에 일어나지 않을까?
    * 그렇다면, 이를 어떻게 알아볼가 (검증할까?)
  * 극화된 의견만 표출되는 경향으로 대중의 공공의견이 (public opinion) 왜곡되는 경향이 있다. 
    * 의견이 불분명하거나 아직 확실하지 않은 사람은 의견표출이 없는 경향을 갖고 있으며
    * 극단치의 의견만이 표면에 들어나게 된다. 
====== Week04  ======
[[:anova note]]
영상
  * [[https://www.youtube.com/watch?v=sK02oxyItHc|ANOVA (F-test) 원리]]
  * [[https://www.youtube.com/watch?v=DP4rCJdnD4c|ANOVA post-hoc test와 R에서의 예]]
  * [[https://www.youtube.com/watch?v=rQIQ-P_VQHU|Factorial ANOVA]]
  * [[https://www.youtube.com/watch?v=Uz_DYDlEPEc|Factorial ANOVA 예 (R 포함)]]
문서 + 텍스트 
  * [[:ANOVA]]
    * [[:r:ANOVA|ANOVA in R]]
  * [[:Factorial ANOVA]]
===== Class Activity =====
out of class 
  * intervene --
  * inter + ven(e) = between + come 
    * prevent
    * convention
    * convene
    * revenue
    * venue : place people to come
    * convenient : to come together -> suit -> fit
    * adventure : things about to happen (곧 일어날 일)
    * invention : into + come : about to know : discovered 
    * event
----
==== Hypothesis ====
  * 가설 만들어 보기
    * No need to read [[:theories]]
    * [[:the third person effect]]
    * [[:Spiral of Silence]]
      * 원 이론은 사람들은 다른 사람들의 생각, 의견에 대한 파악이 
      * 무의식적이지만 체계적으로 혼돈없이 잘 일어날 것을 가정한다. 
      * 그렇다면 이것이 온라인에서는 어떨까?
        * 온라인에서 소수의 아이디어를 가진 사람이나 집단이 
        * 다수인 양 한다면 이것이 오프라인에 일어날 때 보다 
        * 더 효과적이지 않을까?
      * 위의 생각에 기반한 가설은 어떻게 세울 수 있을까?
    * [[:cognitive dissonance]]  
  * Read [[:hypothesis]] see 양승찬 논문 가설
    * [[http://behavioralsciencewriting.blogspot.kr/2011/09/how-to-write-hypothesis.html|how to write hypothesis]] at behavioral science writing. 
    * One sample hypothesis [[http://www.socialresearchmethods.net/kb/hypothes.php|Hypothesis]] at www.socialresearchmethods.net
  * Is your hypothesis based on your research on a topic?
  * Can your hypothesis be tested?
  * Does your hypothesis include independent and dependent variables? 
from https://www.verywellmind.com/what-is-a-hypothesis-2795239
  * kinds of hypothesis 
  * Identifying IV and DV (and Intervening Variable)
  * measurement ([[:operationalization]] :: 조작화)
  * Students who eat breakfast will perform better on a math exam than students who do not eat breakfast
  * Identify and its level of measurement (lom, 측정수준): 
    * IV
    * IV's lom 
    * DV
    * DV's lom 
{{:c:ma:2022:pasted:20220920-084047.png}} 
{{:c:ma:2022:pasted:20220920-084213.png}}
{{:c:ma:2022:pasted:20220920-084249.png}}
in [[https://koreascience.kr/article/JAKO201028552429564.pdf]]
===== Concepts and ideas =====
===== Assignment =====
====== Week05 ======
===== ideas and concepts  =====
영상 시청 (8주차까지 볼 동영상입니다) 
  * [[https://www.youtube.com/watch?v=4XLkoalGkms |Variance and Covariance]] 
  * [[https://www.youtube.com/watch?v=9iRb7hBUjSU |Correlation (r) and Regression Analysis]] 
  * [[https://www.youtube.com/watch?v=sXZ3yzJVbRo |Simple Regression e.g.1]]  
  * [[https://www.youtube.com/watch?v=CbV-a5uL8OQ |Simple Regression e.g.2]] 
  * [[https://www.youtube.com/watch?v=Dc67qlz1yKM |Multiple Regression, Intro]]
  * [[https://www.youtube.com/watch?v=n9sainZvAqA |Multiple Regression, e.g ]]
===== ideas and concepts  =====
[[:correlation]]
[[:regression]]
[[:multiple regression]]
  * [[:interpretation_of_multiple_regression]]
  * [[:r:multiple regression|multiple regression in r]]
  * and [[c:ms:multiple regression lecture note for r]]
----
이하는 다음 주에
[[:Partial and semipartial correlation]]
[[:r/Dummy variable]]
[[:Statistical Regression Methods]]
[[:Sequential Regression]]
[[:Mediation Analysis]]
===== Assignment =====
Assignment for all groups 
  * Read [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설]]
  * Read [[:research question]]
  * Read [[:hypothesis]]
==== Group assignment ====
  * 관심사와 관련된 연구보고서를 찾아서 가설을 찾아 아래처럼 정리하시오. 
    * 연구보고서는 자기 조의 주제를 이용하여 도서관이라 구글등을 이용해서 찾아야 합니다. 
    * 양적인 연구보고서야 합니다. 흔히 이런 논문들은 양승찬의 논문과 같은 소주제를 포함합니다.
    * 가설이 포함되어 있어야 (3개 이상) 하고, 이를 이용하여 아래를 정리해야 합니다.
      * 각 가설의 변인의 종류 설명: IV, DV 등 나열
      * 각 가설에 사용된 변인들의 측정수준 설명 
      * 가설의 종류에 대해서 설명 (차이, 연관의 가설)
      * 가설검증 방법을 찾아서 설명 (Result, 결과 등의 섹션)
      * 검증결과를 찾아서 설명
  * 위에서 찾은 연구보고서와 그 가설들을 바탕으로 자기 조만의 가설 만들어 보기 (차이의 가설만 해당, 조원 숫자 이상)
    * 가설에서 사용된 변인의 종류 설명
    * 측정수준 설명 
    * 검증방법 설명
==== 개인과제 ====
[[:regression#eg_simple_regression|simple regression example]] 의 데이터를 R에 불러와서 다음을 손으로 계산하시오.
x <- ph83
y <- spec83 이라고 할 때
ss.y
ss.x
df.x
df.y # or df.tot
sp.xy
cov.xy
cor.xy
b
a
y.pred
ss.tot
ss.reg
ss.res
df.tot # or df.y
df.reg
df.res
f.cal
f.prob
se.b
t.b
t.b.prob
====== Week06 ======
===== ideas and concepts  =====
  
===== Assignment =====
====== Week07 ======
  * [[:r:regression]] in R
  * 8 주차 퀴즈 
===== Activity =====
  * 데이터 불러오기
  * 살피기 ''str(dat)''
  * 가설만들기  
  * 변인관련 실습
    * DV의 SS 값은 무엇인가? 
    * DV의 df 값은 무엇인가?
    * DV의 Variance는 무엇인가?
    * IV와 DV의 Covariance 구하기
      * SP?
      * df?
    * correlation coefficient값은?
    * SSreg 값은?
    * SSres 값은?
    * r square 값은?
    * F test 값은?
  * Regression test
 dat.lm <- lm(account~fammember, data=dat) 
===== Assignment =====
Group assignment
  * Regression test 
  * with data publicly available 
====== Week08 ======
====== Week09  ======
[[:r:dummy_variable]]
[[:multiple_regression_exercise]]
===== ideas and concepts  =====
영상 
  * [[https://www.youtube.com/watch?v=3OUw6ZlUU9k|Partial and Semipartial Correlation]] in Multiple Regression
  * [[https://www.youtube.com/watch?v=lmvSW3Kemfk|Semipartial Correlation]] in Multiple Regression
  * [[https://www.youtube.com/watch?v=uG8VD0HYuHw|Dummy Variables]] in Multiple Regression
  * [[https://www.youtube.com/watch?v=Hkvohwi_Rfs|Beta Coefficient]] in Multiple Regression
----
[[:correlation]]
[[:regression]]
[[:multiple regression]]
  * [[:r:correlation|correlation in r]]
  * [[:r:multiple regression|multiple regression in r]]
[[:Partial and semipartial correlation]]
[[:r:dummy variable]] in r
[[:Statistical Regression Methods]]
[[:Sequential Regression]]
[[../Regression R note ]]
[[:Regression:Note]]
===== Activity =====
[[:Multiple Regression Exercise]]
===== Assignment =====
====== Week10 ======
영상: [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]]
문서
[[:Mediation Analysis]]
[[:r:Path Analysis]] in R
===== ideas and concepts  =====
[[:factor analysis]]
 
===== Assignment =====
그룹과제 1
  * 게시글 제목 형식: Gruop04 를 예로 들면 아래와 같이 작성하세요.
  * [Group04] 요인분석 연습
  * 본문은 직접 작성하거나 아니면 워드프로세서 (아래한글 제외) 작성해도 됩니다.
  * 단 폰트는 fixed-width font를 꼭 사용해야 합니다. D2Coding, 나눔고딕코딩 글씨체 등을 말합니다. 
  * ''직접 게시글을 작성한다면 한글글씨체 옵션이 없기 때문에 Courier New 체를 사용하면 됩니다. ''
  * 분석과정과 아웃풋을 같이 제시하고 해석을 (해석하게 된 이유도 제시) 해야 합니다. 
  * 글을 게시하기 이전에는 다른 조의 (사람들의) 글을 읽을 수 없습니다. 먼저 읽어보려고 임시 게시글을 올리지 마세요. 
  * 과제데이터는 Factor Analysis # [[:factor analysis#excersize]] 참조하세요
  * Data importing and initial analysis: 기본적으로 아래를 수행하여 보고 시작해 보세요. eigen value 값 1은 가이드라인이지 절대적으로 정해진 것은 아닙니다. 
library(psych)
saq <- read.csv("http://commres.net/wiki/_media/r/efa.csv")
head(saq)
round(cov(saq),2)
  * eigenvalue값을 찾아 보고 plot명령어로 그래프를 그리세요.
  * factor 숫자를 결정하고, 그 이유를 설명하세오. 
  * factor analysis 를 위의 factor 숫자를 인풋으로 하여 수행하세요.
    * rotation methods 
    * 여러가지 rotation 방법을 쓰기위해서는 아래를 인스톨해야 합니다. 
install.packages("GPArotation")
library(GPArotation) 
  * orthogonal = 직각 교차 (rotation) = 요인 간 상관관계가 없도록 회전하는 것
  * oblique = 상관관계 허용
  * varimax를 가장 많이 써왔음 
  * oblique 중에서는 oblimin 이 가장 많이 쓰임
  * fa 평션의 경우, oblimin 이 default라고 함 (아닐 수도 있음)
orthogonal rotations: "none", "varimax", "quartimax", "bentlerT", 
                      "equamax", "varimin", "geominT" and "bifactor" 
oblique transformations of the solution: "Promax", "promax", "oblimin", 
                      "simplimax", "bentlerQ, "geominQ" and "biquartimin", 
                      "cluster" 
  * 데이터의 컬럼들을 (변인들) histogram으로 그리세요. 
  * skwedness를 (외도) 고려해서 변인이 normal한지 (정상분포를 이루는지) 판단하세요. 
과제 2.
  * 요사이에 많이 회자되고 있는 chatGPT에 대한 연구를 하려고 한다. 
  * 특히 AI기술을 이용하여 동영상을 제작하는 것에 대한 사람들의 관심도와 기술 사용 동기에 대해서 분석을 하려고 한다.
  * 회귀분석을 한다면 (mediation, multiple regression 등도 오케이) 
    * 어떤 변인들이 수집되어야 하는지를 토대로 
    * 회귀분석을 설명하시오. 
  * 사람들의 기술사용 동기를 분석하고자 factor analysis를 하려고 한다. 
    * 어떻게 설계하고 진행하면 좋을까?
    * 실제 설문에 사용될 변인들을 만들어서 기록하시오.
  * 위의 두 연구를 종합해서 하나의 연구로 만들 수 있을까? 어떤 방법을 써야 하는지 기술하시오. 
====== Week11 ======
===== ideas and concepts  =====
영상시청 
  * [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]] (요인분석)
문서 
  * [[:Factor Analysis]]
===== Assignment =====
====== Week12  ======
[[:r:Social Network Analysis]] in R space
===== ideas and concepts  =====
===== Assignment =====
====== Week13 ======
===== ideas and concepts  =====
fa 
  * model fit
    * chi-sqaure test 
    * RMSE of Approximation
    * GOFI (Goodness of Fit Index) or Adjusted GOFI
  * factor score
    * latent idea (variable): i.e., IQ
[[:social network analysis]]
[[:sna and clustering]] <-- 11/21 목요일 수업에서 쓴 R 스크립트
[[:r:social network analysis tutorial]]
[[:r:social network analysis|sna in r]] 
[[:sna_eg_stanford|Stanford University egs.]]
===== announcement  =====
  * 두번째 시간 퀴즈 03
  * 범위
    * 통계방법 선택하기 
    * ANOVA
    * Factorial ANOVA
    * Correlation
    * Regression
    * Multiple regression
    * Partial and semipartial correlation
    * Using dummy variable
    * Mediation Analysis
    * Path Analysis 
    * Factor analysis
===== Assignment =====
====== Week14 ======
12월 5일 목요일 퀴즈03 
  * 범위는 처음부터 사회관계망 다룬 내용까지입니다. 
[[:XML parsing via API]]
[[:XML parsing vai API 2]]
====== Week15  ======
[[:Mediation Analysis]]
[[:Logistic Regression]]
====== Week16 ======
__**Final-term**__ covers:
계산문제를 제외하고 어떤 상황에서 어떤 통계방법을 써야하는지에 대해서와 아웃풋을 해석하거나 아웃풋에서 답을 유추하는 문제 등은 아래 범위에서 나올 수 있습니다. 
t-test, ANOVA, Factorial ANOVA 
그 외에 수업시간에 다룬 부분은 또한 포함합니다. 
correlation
regression
multiple regression
partial and semipartial correlation
using dummy variables
factor analysis
[[:social network analysis]]
[[:r:social network analysis tutorial|sna tutorial]]
[[:r:social network analysis|sna in r]] 
[[:sna_eg_stanford:lab06|SNA e.g. lab 06]]
Some R outputs will be used to ask the related concepts and ideas (the above).