[[./|Class page]]
Mon Thur 10:30
Week 01: Sep 2, 5
Week 02: Sep 9, 12
Week 03: Sep 16, 19
Week 04: Sep 23, 26
Week 05: Sep 30, Oct 3
Week 06: Oct 7, 10
Week 07: Oct 14, 17
Week 08: Oct 21, 24
Week 09: Oct 28, 31
Week 10: Nov 4, 7
Week 11: Nov 11, 14
Week 12: Nov 18, 21
Week 13: Nov 25, 28
Week 14: Dec 2, 5
Week 15: Dec 9, 12
Week 16: Dec 16, 19
====== Week01 ======
[[../regression lecture note]]
===== ideas and concepts =====
* [[https://www.youtube.com/watch?v=YblmPrNv3sM|Installing R]]
* [[https://www.youtube.com/watch?v=Gzgk2K8inIQ|R use 1]]
* [[https://www.youtube.com/watch?v=zBJfXRlUwdI|R use 2]]
Using [[:theories]]
* [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설|연구문제와 가설]] and
* making [[:hypothesis|hypotheses]]
* {{:the_third_person_effect_sprial_of_silence.pdf|양승찬 논문}}
* 가설 [[:hypothesis#예1]]
Installing R
Using a data set: mtcars
===== Assignment =====
====== Week02 ======
[[:z-test and t-test simulation in r]]
===== Concepts and ideas =====
동영상 시청. 아래 동영상은 교재의 2장 이후를 다루는 내용이면서 계산적인 통계에 대해서 공부하기 위해서 꼭 필요한 내용이므로 숙지하시기 바랍니다. 동영상이 길어서 이 부분은 3주차에도 계속 시청합니다.
* [[https://www.youtube.com/watch?v=-q1VZz7PHf8|통계: 개괄적 소개 1]]
* [[https://www.youtube.com/watch?v=Z7XMMgLLfrQ|통계: 개괄적 소개 2]]
* [[https://www.youtube.com/watch?v=dQ1CYnuU_6s|통계: 개괄적 소개 3]]
* [[https://www.youtube.com/watch?v=cpdTptIl3Eg|분산에서 왜 n-1로 나누는가? 1 ]]
* [[https://www.youtube.com/watch?v=SZwy-cgU40E|분산에서 왜 n-1로 나누는가? 2 ]]
* [[https://www.youtube.com/watch?v=BUTvS4XVDkg|분산에서 왜 n-1로 나누는가? 3 ]]
* [[https://www.youtube.com/watch?v=YYWwmHgX4Yc|자유도]] [[:Degrees of Freedom]]
* [[https://www.youtube.com/watch?v=0O_Dkga0HgA|표준편차]] [[:Standard Deviation]]
* [[https://www.youtube.com/watch?v=mfImOa3_V1o|표준점수]] [[:Standard Score]]
* [[:Standard Error]]
* [[:Hypothesis testing]]
----
* [[:Research Question]]
* [[:Hypothesis]]
* Educated guess (via theories)
* Difference
* Association
* Variables (vs. ideas, concepts, and constructs)
* [[:Operationalization]]
* [[:Variables]],
* [[:level of measurement]]
* [[:level of measurement#Nominal]]
* [[:level of measurement#Ordinal]]
* [[:level of measurement#Interval]]
* [[:level of measurement#Ratio]]
* [[:Types of Variables]]
* see [[http://chohongjoong.com/gnu4/bbs/board.php?bo_table=board02&wr_id=311&sfl=&stx=&sst=wr_datetime&sod=desc&sop=and&page=1|this blog]] written in Korean
* [[:Independent Variable|IV]] 독립변인
* [[:Dependent Variable|DV]] 종속변인
* Control variable 제어변인
* Mediator (Intervening) variable 매개변인
* 간단한 예로서의 [[:mean|평균]] (mean)
* 제곱합 (오차의제곱합, 혹은 이탈의제곱합 혹은 deviation score의제곱합)
* [[:variance|분산]]
* 모집단 추정을 위해서 [[:why n-1|n-1 사용을 하는 이유]]
* [[:degrees of freedom|자유도]]
* [[:Standard Deviation|표준편차]]
* [[:z_score]]
* 샘플평균들의 집합
* [[:Sampling Distribution]] 혹은 Distribution of Sample Means
* Standard Deviation of Sample Means
* [[:Standard Error]], 표준오차
* Central Limit Theorem ([[:Central Limit Theorem]])
* 예측에서의 (평균이 어디에서 나올까의 예측) 신뢰구간
* 검정통계
$$ \text{Inferential Statistics} = \frac {\text{Effects}} {\text{Error}} $$
실제차이를 랜덤차이로 나눈 비율
{{:c:ma:2022:pasted:20220906-201156.png?340}}
\begin{eqnarray*}
s^2 & = \frac {SS}{df} \\
\sqrt{s^2} & = s
\end{eqnarray*}
===== Activities =====
Group forming
* random assignment?
* voluntary formation?
===== Assignment =====
====== Week03 ======
===== Activities =====
Grouping (꼭 할 것)
[[../anova note]]
===== Concepts and ideas =====
영상
Knowledge to understand hypothesis testing
* [[https://www.youtube.com/watch?v=gmnes_O8dSM|Sampling distribution]] or Distribution of the sample mean or Distsribution of sample means
* [[:Sampling distribution]]
* [[https://www.youtube.com/watch?v=ffnQPTIwryM|Mean and variance of sampling distribution]]
* [[https://www.youtube.com/watch?v=-FehYptG-tY|Standard error and hypothesis testing]]
* [[:hypothesis testing]]
[[:t-test]]
* [[https://www.youtube.com/watch?v=3a_Opcy037k|t-test, 4 kinds of]]
* [[https://www.youtube.com/watch?v=zHxytKBNloM|types of (hypothesis testing) error]]
* [[https://www.youtube.com/watch?v=--Omqk9KHbw|t-test in R]]
===== Assignment =====
Group Assignment
가설 만들어 보기
* SNS에서의 그룹극화는 (Group Polarization) 어떻게 일어날까?
* Youtube에서의 콘텐츠노출은 어떻게 극화가 될까?
* filter bubble: Search engine or curating algorithm leads an individual to intellectual or ideological isolation because they feed them information one would agree. (see https://reutersinstitute.politics.ox.ac.uk/news/truth-behind-filter-bubbles-bursting-some-myths)
* 그러나, 검색엔진이나 추천알고리즘이 선택을 정해준다기 보다는
* 다양한 내용의 선택에도 자신의 선호경향의 내용만을 선택하기 때문에 일어나지 않을까?
* 그렇다면, 이를 어떻게 알아볼가 (검증할까?)
* 극화된 의견만 표출되는 경향으로 대중의 공공의견이 (public opinion) 왜곡되는 경향이 있다.
* 의견이 불분명하거나 아직 확실하지 않은 사람은 의견표출이 없는 경향을 갖고 있으며
* 극단치의 의견만이 표면에 들어나게 된다.
====== Week04 ======
영상
* [[https://www.youtube.com/watch?v=sK02oxyItHc|ANOVA (F-test) 원리]]
* [[https://www.youtube.com/watch?v=DP4rCJdnD4c|ANOVA post-hoc test와 R에서의 예]]
* [[https://www.youtube.com/watch?v=rQIQ-P_VQHU|Factorial ANOVA]]
* [[https://www.youtube.com/watch?v=Uz_DYDlEPEc|Factorial ANOVA 예 (R 포함)]]
문서 + 텍스트
* [[:ANOVA]]
* [[:r:ANOVA|ANOVA in R]]
* [[:Factorial ANOVA]]
===== Class Activity =====
out of class
* intervene --
* inter + ven(e) = between + come
* prevent
* convention
* convene
* revenue
* venue : place people to come
* convenient : to come together -> suit -> fit
* adventure : things about to happen (곧 일어날 일)
* invention : into + come : about to know : discovered
* event
----
==== Hypothesis ====
* 가설 만들어 보기
* No need to read [[:theories]]
* [[:the third person effect]]
* [[:Spiral of Silence]]
* 원 이론은 사람들은 다른 사람들의 생각, 의견에 대한 파악이
* 무의식적이지만 체계적으로 혼돈없이 잘 일어날 것을 가정한다.
* 그렇다면 이것이 온라인에서는 어떨까?
* 온라인에서 소수의 아이디어를 가진 사람이나 집단이
* 다수인 양 한다면 이것이 오프라인에 일어날 때 보다
* 더 효과적이지 않을까?
* 위의 생각에 기반한 가설은 어떻게 세울 수 있을까?
* [[:cognitive dissonance]]
* Read [[:hypothesis]]
* [[http://behavioralsciencewriting.blogspot.kr/2011/09/how-to-write-hypothesis.html|how to write hypothesis]] at behavioral science writing.
* One sample hypothesis [[http://www.socialresearchmethods.net/kb/hypothes.php|Hypothesis]] at www.socialresearchmethods.net
* Is your hypothesis based on your research on a topic?
* Can your hypothesis be tested?
* Does your hypothesis include independent and dependent variables?
from https://www.verywellmind.com/what-is-a-hypothesis-2795239
* kinds of hypothesis
* Identifying IV and DV (and Intervening Variable)
* measurement ([[:operationalization]] :: 조작화)
* Students who eat breakfast will perform better on a math exam than students who do not eat breakfast
* Identify and its level of measurement (lom, 측정수준):
* IV
* IV's lom
* DV
* DV's lom
{{:c:ma:2022:pasted:20220920-084047.png}}
{{:c:ma:2022:pasted:20220920-084213.png}}
{{:c:ma:2022:pasted:20220920-084249.png}}
in [[https://koreascience.kr/article/JAKO201028552429564.pdf]]
===== Concepts and ideas =====
===== Assignment =====
Assignment for all groups
* Read [[:research_methods_lecture_note#커뮤니케이션_연구문제_제기와_가설]]
* Read [[:research question]]
* Read [[:hypothesis]]
아래 가설을 그룹디스커션포럼에 작성할 것. 포럼은 아직 생성전입니다.
Group assignment 1
* [[:Hypothesis]] 문서의 [[:hypothesis#예]]의 "제3자 효과이론과 침묵의 나선이론 연계성" 논문을 읽고 가설을 기술하시오.
* 각 가설의 독립변인(Independent variables), 종속변인 (dependent variables) 등을 나열하시오.
Group assignment 2
가설 만들어 보기
t-test 와 ANOVA 가설 만들기
* 모든 가설은 자기 조의 관심사와 관련이 있어야 합니다.
* t-test 의 경우, 2종류 가설
* 모집단 평균과 표준편차를 알고 있을 경우의 가설
* 모집단의 파라미터를 모르는 두 집단의 평균과 표준편차만을 알고 있을 경우의 가설
* ANOVA 가설
* One-way ANOVA
* Two-way ANOVA
====== Week05 ======
[[:c:ma:exercise.01|퀴즈 01 연습문제]]
===== ideas and concepts =====
영상 시청 (8주차까지 볼 동영상입니다)
* [[https://www.youtube.com/watch?v=4XLkoalGkms |Variance and Covariance]]
* [[https://www.youtube.com/watch?v=9iRb7hBUjSU |Correlation (r) and Regression Analysis]]
* [[https://www.youtube.com/watch?v=sXZ3yzJVbRo |Simple Regression e.g.1]]
* [[https://www.youtube.com/watch?v=CbV-a5uL8OQ |Simple Regression e.g.2]]
* [[https://www.youtube.com/watch?v=Dc67qlz1yKM |Multiple Regression, Intro]]
* [[https://www.youtube.com/watch?v=n9sainZvAqA |Multiple Regression, e.g ]]
===== ideas and concepts =====
[[:correlation]]
[[:regression]]
[[:multiple regression]]
* [[:r:correlation|correlation in r]]
* [[:r:multiple regression|multiple regression in r]]
* and [[c:ms:multiple regression lecture note for r]]
----
이하는 다음 주에
[[:Partial and semipartial correlation]]
[[:r/Dummy variable]]
[[:Statistical Regression Methods]]
[[:Sequential Regression]]
[[:Mediation Analysis]]
===== Assignment =====
개인과제
[[:regression#eg_simple_regression|simple regression example]] 의 데이터를 R에 불러와서 다음을 손으로 계산하시오.
x <- ph83
y <- spec83 이라고 할 때
ss.y
ss.x
df.x
df.y # or df.tot
sp.xy
cov.xy
cor.xy
b
a
y.pred
ss.tot
ss.reg
ss.res
df.tot # or df.y
df.reg
df.res
f.cal
f.prob
se.b
t.b
t.b.prob
====== Week06 ======
===== ideas and concepts =====
===== Assignment =====
- Public opinion in online environments ((refer to {{:public.opinion.theories.introduction.pdf}} ))
* [[:Spiral of Silence]]
* [[:Pluralistic Ignorance]]
* [[:The Third Person Effect]]
* etc. 여론형성과 관련된 사회학적 혹은 사회심리학적 이론을 찾아보고 소개하기, 예로 위의 세가지. 얼마전 사회현상을 어떻게 설명하면 좋을까에 대해서 논의정리하기? 정확한 온라인 환경에서의 여론파악을 위해서 어떤 것이 필요할까?
* 혹은 다른 문제에 대해서 (. . . 조에 따른 . . .)
- Hypotheses
* Multiple regression hypotheses.
* Google Survey Questions
====== Week07 ======
* [[.schedule/note_r]]
* standardized coefficient in r (beta coefficient in mr)
* lm.beta(model)
* lm.beta(m.sa.ytfbnp)
===== Activity =====
* 데이터 불러오기
dat <- read.csv("http://commres.net/wiki/_media/regression01-bankaccount.csv")
* 살피기 ''str(dat)''
* 가설만들기 : 독립변인으로 fammember를, 종속변인으로 account를 (통장갯수를)
* ?
* 변인관련 실습
* DV의 SS 값은 무엇인가?
* DV의 df 값은 무엇인가?
* DV의 Variance는 무엇인가?
* IV와 DV의 Covariance 구하기
* SP?
* df?
* correlation coefficient값은?
* SSreg 값은?
* SSres 값은?
* r square 값은?
* F test 값은?
* Regression test
dat.lm <- lm(account~fammember, data=dat)
===== Assignment =====
====== Week08 ======
__**Mid-term period**__
한 연구자가 Performance와 각성(arousal) 간의 관계에 대한 연구를 하였다. 연구자는 문제를 해결하는 능력을 측정하는 실험을 아래와 같이 하여, 정리하였다.
{{:c:ma:2021:pasted:20211021-091855.jpeg}}
{{:c:ma:2021:pasted:20211021-091425.jpeg?350}}
{{:c:ma:2021:pasted:20211021-091819.jpeg?350}}
====== Week09 ======
===== ideas and concepts =====
영상
* [[https://www.youtube.com/watch?v=3OUw6ZlUU9k|Partial and Semipartial Correlation]] in Multiple Regression
* [[https://www.youtube.com/watch?v=lmvSW3Kemfk|Semipartial Correlation]] in Multiple Regression
* [[https://www.youtube.com/watch?v=uG8VD0HYuHw|Dummy Variables]] in Multiple Regression
* [[https://www.youtube.com/watch?v=Hkvohwi_Rfs|Beta Coefficient]] in Multiple Regression
----
[[:correlation]]
[[:regression]]
[[:multiple regression]]
* [[:r:correlation|correlation in r]]
* [[:r:multiple regression|multiple regression in r]]
[[:Partial and semipartial correlation]]
[[:r:dummy variable]] in r
[[:Statistical Regression Methods]]
[[:Sequential Regression]]
[[../Regression R note ]]
[[:Regression:Note]]
===== Activity =====
[[:Multiple Regression Exercise]]
===== Assignment =====
====== Week10 ======
영상: [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]]
문서
[[:Mediation Analysis]]
[[:r:Path Analysis]] in R
===== ideas and concepts =====
[[:factor analysis]]
===== Assignment =====
그룹과제 1
* 게시글 제목 형식: Gruop04 를 예로 들면 아래와 같이 작성하세요.
* [Group04] 요인분석 연습
* 본문은 직접 작성하거나 아니면 워드프로세서 (아래한글 제외) 작성해도 됩니다.
* 단 폰트는 fixed-width font를 꼭 사용해야 합니다. D2Coding, 나눔고딕코딩 글씨체 등을 말합니다.
* ''직접 게시글을 작성한다면 한글글씨체 옵션이 없기 때문에 Courier New 체를 사용하면 됩니다. ''
* 분석과정과 아웃풋을 같이 제시하고 해석을 (해석하게 된 이유도 제시) 해야 합니다.
* 글을 게시하기 이전에는 다른 조의 (사람들의) 글을 읽을 수 없습니다. 먼저 읽어보려고 임시 게시글을 올리지 마세요.
* 과제데이터는 Factor Analysis # [[:factor analysis#excersize]] 참조하세요
* Data importing and initial analysis: 기본적으로 아래를 수행하여 보고 시작해 보세요. eigen value 값 1은 가이드라인이지 절대적으로 정해진 것은 아닙니다.
library(psych)
saq <- read.csv("http://commres.net/wiki/_media/r/efa.csv")
head(saq)
round(cov(saq),2)
* eigenvalue값을 찾아 보고 plot명령어로 그래프를 그리세요.
* factor 숫자를 결정하고, 그 이유를 설명하세오.
* factor analysis 를 위의 factor 숫자를 인풋으로 하여 수행하세요.
* rotation methods
* 여러가지 rotation 방법을 쓰기위해서는 아래를 인스톨해야 합니다.
install.packages("GPArotation")
library(GPArotation)
* orthogonal = 직각 교차 (rotation) = 요인 간 상관관계가 없도록 회전하는 것
* oblique = 상관관계 허용
* varimax를 가장 많이 써왔음
* oblique 중에서는 oblimin 이 가장 많이 쓰임
* fa 평션의 경우, oblimin 이 default라고 함 (아닐 수도 있음)
orthogonal rotations: "none", "varimax", "quartimax", "bentlerT",
"equamax", "varimin", "geominT" and "bifactor"
oblique transformations of the solution: "Promax", "promax", "oblimin",
"simplimax", "bentlerQ, "geominQ" and "biquartimin",
"cluster"
* 데이터의 컬럼들을 (변인들) histogram으로 그리세요.
* skwedness를 (외도) 고려해서 변인이 normal한지 (정상분포를 이루는지) 판단하세요.
과제 2.
* 요사이에 많이 회자되고 있는 chatGPT에 대한 연구를 하려고 한다.
* 특히 AI기술을 이용하여 동영상을 제작하는 것에 대한 사람들의 관심도와 기술 사용 동기에 대해서 분석을 하려고 한다.
* 회귀분석을 한다면 (mediation, multiple regression 등도 오케이)
* 어떤 변인들이 수집되어야 하는지를 토대로
* 회귀분석을 설명하시오.
* 사람들의 기술사용 동기를 분석하고자 factor analysis를 하려고 한다.
* 어떻게 설계하고 진행하면 좋을까?
* 실제 설문에 사용될 변인들을 만들어서 기록하시오.
* 위의 두 연구를 종합해서 하나의 연구로 만들 수 있을까? 어떤 방법을 써야 하는지 기술하시오.
====== Week11 ======
===== ideas and concepts =====
영상시청
* [[https://www.youtube.com/watch?v=AXMtT5cYpZ4|Factor Analysis]] (요인분석)
문서
* [[:Factor Analysis]]
===== Assignment =====
====== Week12 ======
[[:r:Social Network Analysis]] in R space
===== ideas and concepts =====
===== Assignment =====
====== Week13 ======
===== ideas and concepts =====
fa
* model fit
* chi-sqaure test
* RMSE of Approximation
* GOFI (Goodness of Fit Index) or Adjusted GOFI
* factor score
* latent idea (variable): i.e., IQ
[[:social network analysis]]
[[:sna and clustering]] <-- 11/21 목요일 수업에서 쓴 R 스크립트
[[:r:social network analysis tutorial]]
[[:r:social network analysis|sna in r]]
[[:sna_eg_stanford|Stanford University egs.]]
===== announcement =====
* 두번째 시간 퀴즈 03
* 범위
* 통계방법 선택하기
* ANOVA
* Factorial ANOVA
* Correlation
* Regression
* Multiple regression
* Partial and semipartial correlation
* Using dummy variable
* Mediation Analysis
* Path Analysis
* Factor analysis
===== Assignment =====
====== Week14 ======
12월 5일 목요일 퀴즈03
* 범위는 처음부터 사회관계망 다룬 내용까지입니다.
[[:XML parsing via API]]
[[:XML parsing vai API 2]]
====== Week15 ======
[[:Mediation Analysis]]
[[:Logistic Regression]]
====== Week16 ======
__**Final-term**__ covers:
계산문제를 제외하고 어떤 상황에서 어떤 통계방법을 써야하는지에 대해서와 아웃풋을 해석하거나 아웃풋에서 답을 유추하는 문제 등은 아래 범위에서 나올 수 있습니다.
t-test, ANOVA, Factorial ANOVA
그 외에 수업시간에 다룬 부분은 또한 포함합니다.
correlation
regression
multiple regression
partial and semipartial correlation
using dummy variables
factor analysis
[[:social network analysis]]
[[:r:social network analysis tutorial|sna tutorial]]
[[:r:social network analysis|sna in r]]
[[:sna_eg_stanford:lab06|SNA e.g. lab 06]]
Some R outputs will be used to ask the related concepts and ideas (the above).