all(408)
-
17. 회귀분석 II
SNUON 통계학 선형회귀분석 1. 직선적합, 잔차, 상관관계 2. 최소제곱추정법 3. 이상점 4. 회귀분석의 추론 17-1. 회귀분석모형의 적합 Extrapolation - 주어진 자료의 범위 밖에서 모형을 이용하여 예측하는 것을 외삽(extrapolation)이라고 한다 - 절편이 외삽에 해당하는 경우가 종종 있다 Examples of Extrapolation Conditions for the least square line 1) 선형관계 (Linearity) 2) 정규분포 (Nearly normal residuals) 3) 등분산성 (Constant variability) Conditions (1) Linearity - 반응변수와 설명변수의 관계는 선형이어야 한다 - 반응변수와 설명변수의 관계가 비..
2020.01.15 -
16. 회귀분석 I
SNUON 통계학 선형회귀분석 1. 직선적합, 잔차, 상관관계 2. 최소제곱추정법 3. 이상점 4. 회귀분석의 추론 16-1. 직선적합, 잔차, 상관관계 1) 범주형 변수 하나, 연속형 변수 하나 : 분산분석 (ex) 각 반의 평균 비교 2) 범주형 변수 두개 : 분할표 (ex) 카이제곱 검정 (독립성/동일성 검정) 3) 연속형 변수 두개 : 선형회귀분석 Modeling numerical variables 두 연속변수 사이의 관계를 모형화하는 방법을 배우고 특히 한 변수를 이용하여 다른 변수를 예측할 경우에 대해서 알아보자 Poverty vs. HS graduate rate 아래 scatterplot (산점도)는 미국 50개 주와 DC에서 고등학교 졸업률과 빈곤율 사이의 관계를 보여준다 - 반응변수는? ..
2020.01.15 -
15. 모비율에 관한 추론 II
SNUON 통계학 범주형 자료의 추론 1. 일표본비율에 관한 추론 2. 이표본비율의 차이에 관한 추론 3. Goodness of fit test와 카이제곱 분포 4. 분할표에서 독립성 검정 5. 소표본에서 표본비율에 관한 검정 6. 역학 (epidemiology) 에서 2*2 분할표 분석 15-1. 적합성 검정과 카이제곱 분포 (예제) Small Sample inference for a proportion 2009 이란 선거결과 - 2009년 이란 선거에 선거부정이 있었는지 알아보자 - 출구조사(관측치) vs 실제 선거 결과(기댓값 = 득표율 * 출구조사 인원) - Observed # vs Expected # 가설검정 - H_0 : The observed counts from the poll follow..
2020.01.14 -
14. 모비율에 관한 추론 I
SNUON 통계학 범주형 자료의 추론 1. 일표본비율에 관한 추론 2. 이표본비율의 차이에 관한 추론 3. Goodness of fit test와 카이제곱 분포 4. 분할표에서 독립성 검정 5. 소표본에서 표본비율에 관한 검정 6. 역학 (epidemiology) 에서 2*2 분할표 분석 14-1. 단일표본 비율에 관한 추론 표본비율이 정규분포를 따를 조건 - 한국 갤럽에서 2019년 1월 미세먼지 나쁨 예보 발령 시 마스크의 착용 여부에 대한 여론조사를 실시하였다. 1000명의 조사대상자 중 53%가 마스크를 착용한다고 대답하였다 - 여기서 응답자가 마스크를 착용한다고 한 경우를 1, 그렇지 않은 경우를 0이라고 하자. 이 경우 표본비율은 0과 1로 이루어진 응답들의 평균이다. * 0과 1로만 이루어진..
2020.01.12 -
13. 분산분석 ANOVA
SNUON 통계학 13-1. 3개 이상의 표본의 평균차이에 관한 추론 예제 : 강좌별 시험점수 비교 서울대 통계학과에서 이번 학기 통계학 교양 과목을 공대생 대상으로 3강좌를 제공한다. 강좌별로 중간고사 성적이 차이가 있는지 여부를 알고 싶다. 이 경우 적합한 가설검정은 무엇인가? 귀무가설 : 강좌별 중간고사 평균점수는 차이가 없다 대립가설 : 강좌별 중간고사 평균점수는 다르다 cf. 모집단 2개(Paired Data) : 두 평균의 차이가 0이냐 아니냐 문제로 해석 만약 3개 이상의 집단을 비교하고 싶다면? - F-검정을 이용한 분산분석 ANOVA (Analysis of Variance) - 분산분석을 하기 위한 3가지 조건 1) 각 그룹은 서로 독립이며 그룹 안의 관측치도 서로 독립이다 2) 각 그룹..
2020.01.11 -
12. 모평균에 관한 추론 II
SNUON 통계학 Inference for Numerical Data 1. 일 표본평균과 t-분포 2. Paired data에 관한 추론 3. 두 표본평균의 차이에 관한 추론 4. Power Analysis 5. ANOVA 12-1. 두 표본의 평균 차이에 관한 추론 예제 : 다이아몬드 - 다이아몬드의 무게는 캐럿으로 표기한다 - 1캐럿은 100point라고 한다면 0.99캐럿은 99점이다 - 사람의 눈으로 1캐럿과 0.99캐럿은 구별할 수 없지만, 1캐럿의 가격이 0.99캐럿의 가격보다 훨씬 비싸지 않을까? - 이 경우 양측검정을 사용해야 할까? 아니면 단측검정을 사용해야 할까? 가설검정 - 귀무가설 : 0.99캐럿과 1캐럿 다이아몬드의 가격이 같다 - 대립가설 : 1캐럿이 0.99캐럿 다이아몬드보다 ..
2020.01.07