b:head_first_statistics:visualization
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
b:head_first_statistics:visualization [2024/09/04 08:26] – [Histogram] hkimscil | b:head_first_statistics:visualization [2024/09/04 08:49] (current) – [Scatter plot] hkimscil | ||
---|---|---|---|
Line 138: | Line 138: | ||
| | ||
- | {{:c:ps1-1:2019:pasted:20190909-075028.png}} | + | {{:b:head_first_statistics:pasted:20240904-083016.png}} |
explanatory (설명) variable at x axis | explanatory (설명) variable at x axis | ||
Line 146: | Line 146: | ||
Drawing a line among the data. | Drawing a line among the data. | ||
+ | |||
< | < | ||
abline(lm(mpg~wt), | abline(lm(mpg~wt), | ||
- | lines(lowess(wt, | + | </ |
- | {{:c:ps1-1:2019:pasted:20190909-075639.png}} | + | {{:b:head_first_statistics:pasted:20240904-083157.png}} |
+ | |||
+ | Outlier에 대한 주의 | ||
+ | [{{: | ||
+ | <WRAP clear /> | ||
Line 161: | Line 166: | ||
| | ||
{{: | {{: | ||
- | |||
- | Line can be: | ||
- | |||
- | **__관계의 방향 (direction)__** | ||
- | ^ 관계의 방향 | ||
- | | {{: | ||
- | |||
- | |||
- | **__관계의 모양 (shape)__** | ||
- | ^ 관계의 모양 | ||
- | | {{: | ||
- | |||
- | **__관계의 정도 (힘)__** | ||
- | ^ 관계의 정도 (힘) ^^ | ||
- | | [{{: | ||
- | | [{{: | ||
- | <WRAP clear /> | ||
- | Pearson' | ||
- | __Relations, | ||
- | [{{: | ||
- | <WRAP clear /> | ||
- | |||
- | __Interpretation with limited range__ | ||
- | [{{: | ||
- | [{{: | ||
- | 데이터의 [[Range]]에 대한 판단에 신중해야 한다. 왜냐 하면, 데이터의 어느 곳을 자르느냐에 따라서 r 값이 심하게 변하기 때문이다. | ||
- | <WRAP clear /> | ||
- | __Outliers__ | ||
- | [{{: | ||
- | [{{: | ||
- | 위의 설명과 관련하여, | ||
- | [{{: | ||
- | |||
- | make it sure that there is __no data entry error__. | ||
- | {{: | ||
- | |||
<WRAP clear /> | <WRAP clear /> | ||
- | see | + | ====== Presentation ====== |
+ | For a very good example, | ||
https:// | https:// | ||
* Life expectancy data: {{: | * Life expectancy data: {{: | ||
- | <code> | + | <WRAP clear/> |
- | le <- as.data.frame(read.csv(" | + | ====== Histogram skewedness ====== |
- | colnames(le)[1] <- " | + | |
- | lea <- le$X2017 | + | |
- | leb <- lea[complete.cases(lea)] | + | |
- | hist(leb, color=" | + | |
- | </ | + | |
- | [{{: | ||
- | <WRAP clear/>. | ||
- | [{{: | ||
- | <WRAP clear/>. | ||
[{{: | [{{: | ||
<WRAP clear/>. | <WRAP clear/>. | ||
[{{: | [{{: | ||
<WRAP clear/>. | <WRAP clear/>. | ||
- | box plot | + | ====== |
< | < | ||
# Boxplot of MPG by Car Cylinders | # Boxplot of MPG by Car Cylinders |
b/head_first_statistics/visualization.1725406019.txt.gz · Last modified: 2024/09/04 08:26 by hkimscil