stats(32)
-
13. 분산분석 ANOVA
SNUON 통계학 13-1. 3개 이상의 표본의 평균차이에 관한 추론 예제 : 강좌별 시험점수 비교 서울대 통계학과에서 이번 학기 통계학 교양 과목을 공대생 대상으로 3강좌를 제공한다. 강좌별로 중간고사 성적이 차이가 있는지 여부를 알고 싶다. 이 경우 적합한 가설검정은 무엇인가? 귀무가설 : 강좌별 중간고사 평균점수는 차이가 없다 대립가설 : 강좌별 중간고사 평균점수는 다르다 cf. 모집단 2개(Paired Data) : 두 평균의 차이가 0이냐 아니냐 문제로 해석 만약 3개 이상의 집단을 비교하고 싶다면? - F-검정을 이용한 분산분석 ANOVA (Analysis of Variance) - 분산분석을 하기 위한 3가지 조건 1) 각 그룹은 서로 독립이며 그룹 안의 관측치도 서로 독립이다 2) 각 그룹..
2020.01.11 -
12. 모평균에 관한 추론 II
SNUON 통계학 Inference for Numerical Data 1. 일 표본평균과 t-분포 2. Paired data에 관한 추론 3. 두 표본평균의 차이에 관한 추론 4. Power Analysis 5. ANOVA 12-1. 두 표본의 평균 차이에 관한 추론 예제 : 다이아몬드 - 다이아몬드의 무게는 캐럿으로 표기한다 - 1캐럿은 100point라고 한다면 0.99캐럿은 99점이다 - 사람의 눈으로 1캐럿과 0.99캐럿은 구별할 수 없지만, 1캐럿의 가격이 0.99캐럿의 가격보다 훨씬 비싸지 않을까? - 이 경우 양측검정을 사용해야 할까? 아니면 단측검정을 사용해야 할까? 가설검정 - 귀무가설 : 0.99캐럿과 1캐럿 다이아몬드의 가격이 같다 - 대립가설 : 1캐럿이 0.99캐럿 다이아몬드보다 ..
2020.01.07 -
11. 모평균에 관한 추론 I
SNUON 통계학 Inference for Numerical Data 1. 일 표본평균과 t-분포 2. Paired data에 관한 추론 3. 두 표본평균의 차이에 관한 추론 4. Power Analysis 5. ANOVA 11-1. 단일표본 평균과 t-분포 통계적 추정의 과정 1) 가설검정 2) 점 추정치, 구간 추정치(신뢰구간) 13일의 금요일은 정말 불길한 날짜인가? - 이 연구의 목적은 사람들의 행동방식이 13일의 금요일과 그 전주인 6일의 금요일이 차이가 있는지 알고자 하는데 있다 - 이 두 날짜의 교통량을 비교하는 것으로 사람들의 행동양식을 비교하고자 했다 - 질문 : 연구자들은 왜 이러한 비교방식을 선택했을까? 1) 가설검정 - H0 : 13일 금요일과 6일 금요일의 평균 교통량은 같다 - ..
2020.01.07 -
10. 중심극한정리와 검정력
SNUON 통계학 10-1. 중심극한정리 중심극한정리 - 표본크기가 30 이상이고 모집단의 분포가 심각하게 skewed 되어 있지 않다면, 표본평균의 분포는 정규분포를 따른다 - 표본 크기가 30 이상이면 모집단의 분포와 상관없이, 표본평균의 분포는 *정규분포를 따른다 * N(모집단의 평균 , 모집단의 분산÷표본크기(n)) 예제 : 모집단이 uniform, exponential, log-nrmal 분포일 때 표본평균의 분포 10-2. 표본수결정과 검정력 데이터를 보지 않고도 유의수준 5% 이하인 가설검정 만들 수 있다 (ex) 1-100까지 랜덤하게 숫자 뽑는데 1-5가 나오면 유죄, 나머지는 무죄로 판결 - 무죄인 사람 100명 오면 항상 5명은 유죄로 판결함. 따라서 유의수준은 5% 이하 - 그러나 ..
2020.01.07 -
9. Resampling과 가설검정
SNUON 통계학 9-1. Resampling (Bootstrap) Resampling - 신뢰구간을 유도하는 과정은 중심극한정리에 의존한다 - 만약 우리가 분산, 혹은 변동계수 (표준편차 ÷ 평균)의 신뢰구간을 구하고 싶다면 어떻게 해야 할까? - 방법 1 : 분산(변동계수)의 추정치인 표본분산 (표본 변동계수) 를 구한 후 추정치의 sampling distribution을 이론적으로 계산한 후 이를 바탕으로 신뢰구간을 구한다 - 방법 2 : 방법 1과 같은 방식을 사용하지만 sampling distribution을 bootstrap을 사용해 구한다 - 이론적으로 sampling distribution을 알 수 없다면 어떻게 sampling distribution을 알아낼 수 있을까? - 만약 우리가 ..
2019.12.18 -
8. 통계적추론의 개요
SNUON 통계학 8-1. 표본분포 통계적 추론 - 지금까지는 평균, 특정 사건이 나타날 확률 등이 주어져있고 이를 통해 계산함 - 하지만 실제 세계에서 평균이나 확률을 정확히 알긴 어려움. 이러한 값을 추정하는 것이 통계적 추론 추정 - 우리는 데이터를 통해 모집단의 모수(population parameter)를 알아내고자 한다 - 예를 들면 모집단이 정규분포를 따른다면 모집단의 평균과 표준편차만 알면 모집단에 대한 대부분의 정보를 아는 것이다 - 일반적으로 모집단 전체를 자료로 모으는 것은 거의 불가능하므로 우리는 모집단의 일부를 sampling을 통해 표본으로 얻은 후에 표본 통계량(sample statistic)을 이용해 모집단의 모수를 추정한다. - 데이터가 어떤 분포를 따르는지 알고, 그 분포..
2019.12.18