자료 유형에 따른 시각화 방법

2019. 10. 30. 20:38stats

반응형

학교 수업 내용 

 

[시각화의 기본]

- 가로축은 주어진 대상, 세로축은 분석하려는/예측하려는 대상

- 변수 하나당 하나의 차원 (변수 2개면 2차원)


Univariate 
1) 수치형(n) : stem, hist, boxplot
    ※ cluster의 유무 (cluster 있으면 더 이상 분석 불가)
2) 범주형(c) : bar plot(막대 그래프)

Bivariate
1) n,n : scatter 

    * scatter는 두 변수의 '관계'에 주목 

2) n,c : boxplot, ANOVA 검정
3) c,n : logistic regression 
4) c,c : bar plot, x^2 검정(독립성/동질성 검정)

Multivariate
1) n,n,n,... : scatter plot matrix 
2) c,c,c,... : bar plot 
3) n,c,n,c,... : lattice/grid graph (subsetting)
     ex) 4가지 변수가 성별,찬반,나이,소득인 경우 : 여성&찬성/여성&반대/남성&찬성/남성&반대로 subsetting

반응형

'stats' 카테고리의 다른 글

5. 조건부 확률과 확률변수  (0) 2019.11.11
4. 확률이란?  (0) 2019.10.31
3. 자료의 유형과 사례연구  (0) 2019.10.28
2. 자료 수집  (0) 2019.10.21
1. 통계학이란?  (0) 2019.10.20