stats(32)
-
Micro- and Macro F1 scores
1. Micro Averaged Metrics 2. Macro Averaged Metrics
2020.10.07 -
24. 로지스틱 회귀분석 II
SNUON 통계학 로지스틱 회귀분석 1. 단순 로지스틱 회귀분석 2. 회귀계수의 추론 3. 다중 로지스틱 회귀분석 4. Case Study 24-1. 로지스틱 회귀분석에서의 추론 회귀계수의 추정 - 로지스틱 회귀분석에서는 최대우도법을 통해서 회귀계수들을 추정한다 - 최대우도법 : 회귀계수 값을 계속 변화시키면서 주어진 자료가 관측될 확률을 가장 높게 할 회귀계수를 추정치로 선택함 - 즉 가능한 회귀계수의 값에서 주어진 자료가 관측이 될 확률을 최대로 하는 회귀계수의 값을 추정치로 사용한다 - R과 같은 통계 패키지를 사용하여 추정치와 추정치의 표준오차를 구할 수 있다 예제 : 관상동맥 심장질환 - 관상동맥 심장질환 예제에서 회귀계수의 추정치와 표준오차는 다음과 같이 주어진다 - 한 살 차이가 나는 그룹을..
2020.01.21 -
23. 로지스틱 회귀분석 I
SNUON 통계학 로지스틱 회귀분석 1. 단순 로지스틱 회귀분석 2. 회귀계수의 추론 3. 다중 로지스틱 회귀분석 4. Case Study 23-1. 단순 로지스틱 회귀분석 로지스틱 회귀분석 사용 예 - 유전자 정보를 이용하여 환자의 유방암 발병율을 예측한다 - 이메일이 스펨메일인지 아닌지 여부를 알아낸다 - 한약재의 화학적 성분을 이용하여 한국산/중국산 여부를 알아낸다 → 반응변수가 binary 예제 : 관상동맥 심장질환 관상동맥 심장질환(CHD)과 나이와의 관계에 대해 알아보고자 한다 병원환자 중 58명을 대상으로 관상동맥 심장질환여부와 나이를 조사한 결과 연령층은 20-64세였고, 이 중 43%가 관상동맥 심장질환을 앓고 있었다 반응변수가 binary인 경우 목표 : 나이와 흡연이 CHD의 위험요인..
2020.01.21 -
22. 2x2 분할표 II
SNUON 통계학 2x2 분할표 1. 역학설계연구 2. McNemar test for paired data 3. Fisher's exact test 4. 심슨의 역설 22-1. McNemar 검정 2x2 분할표 - 백신임상실험에 관한 지식 설문조사를 2번에 걸쳐서 실시함 - 처음 설문조사 후 6개월이 지난 후 동의서 절차를 거친 후에 두번째 설문조사를 실시 6개월 이후 틀림 6개월 이후 맞힘 합계 처음에 틀림 251 178 429 처음에 맞힘 68 98 166 합계 319 276 595 - 첫번째 설문조사에서 오답율 : 429/595 = 0.72 - 두번째 설문조사에서 오답율 : 319/595 = 0.54 McNemar 검정 - Matched-Case-Control : 사례군과 대조군을 성별/나이에 따라..
2020.01.21 -
21. 2x2 분할표 I
SNUON 통계학 2x2 분할표 1. 역학설계연구 2. McNemar test for paired data 3. Fisher's exact test 4. 심슨의 역설 21-1. 역학연구설계 Study Design 자료 유형별 분석방법 반응변수_이산형 반응변수_연속형 설명변수_이산형 분할표 분석 분산분석 설명변수_연속형 로지스틱 회귀분석 회귀분석 예제1 : 아스피린과 심근경색 40세에서 84세 사이의 남자의사 22,071명을 대상으로 절반은 아스피린, 나머지 절반은 위약(placebo)을 준 후 심근경색 발병 여부를 조사 심근경색 O 심근경색 X 합계 아스피린 104 10,933 11,037 위약 189 10,845 11,034 합계 293 21,778 22,071 질문 : 아스피린이 심근경색 예방에 도움..
2020.01.21 -
20. 다중회귀분석 II
SNUON 통계학 20-1. 모형선택 Model Selection 강의평가와 외모 - University of Texas 학생들을 대상으로 강사의 외모와 강의평가를 실시하게 하였다 - 6명의 학생들로 이루어진 별도의 평가단이 강사의 외모를 평가하였으며 이 학생들은 해당수업 수강생은 아니었다 외모와 강의평가 단순회귀분석 - p-value < 0.05 니까 통계적으로 유의미한가? 그런데 기울기 값이 0.13밖에 안 됨 - 데이터가 매우 많음. 검정력(Power)도 커져서 귀무가설 쉽게 기각 - 예를 들어 실제 기울기 값은 0.0001 인데 0은 아니니까 귀무가설 기각 가능 - R^2 을 보아 3% 정도 설명 가능한 모델 성별에 따른 차이가 있는가? → 외모가 같다는 가정 하에 남성 교수가 여성 교수보다 강의..
2020.01.15