all(408)
-
4. 확률이란?
SNUON 통계학 강의 4-1. 확률의 정의 1. 확률의 정의 Kolmogorov's Axioms "P(A) = 사건 A가 일어날 확률"이라고 하면 확률은 다음의 공리를 따른다 1) 확률은 0과 1 사이에 있다. 2) P(가능한 무엇인가는 일어난다) = 1 (*전체 집합이 1이라는 의미) 3) 만약 사건 A와 B가 동시에 관측될 수 없다면 P(A or B) = P(A) + P(B) 확률의 정의 1) Frequentist : P(A) = lim (n→∞) # times A happens / n - 동전 던지기와 같이 우리가 발생 가능한 사건(앞면/뒷면)을 모두 알고 있지만, 시행 후 어떤 사건이 발생할지 모르는 경우를 random process라고 한다. - 어떤 사건이 일어날 확률은 random proc..
2019.10.31 -
칸 아카데미로 딥러닝을 위한 수학 공부하기 | Linear Combinations and Spans
Linear Algebra > Vectors and Spaces > Linear combinations and spans 부분을 정리한 것. https://www.khanacademy.org/math/linear-algebra/vectors-and-spaces#linear-combinations Vectors and spaces | Linear algebra | Math | Khan Academy If you're seeing this message, it means we're having trouble loading external resources on our website. If you're behind a web filter, please make sure that the domains *.kas..
2019.10.30 -
자료 유형에 따른 시각화 방법
학교 수업 내용 [시각화의 기본] - 가로축은 주어진 대상, 세로축은 분석하려는/예측하려는 대상 - 변수 하나당 하나의 차원 (변수 2개면 2차원) Univariate 1) 수치형(n) : stem, hist, boxplot ※ cluster의 유무 (cluster 있으면 더 이상 분석 불가) 2) 범주형(c) : bar plot(막대 그래프) Bivariate 1) n,n : scatter * scatter는 두 변수의 '관계'에 주목 2) n,c : boxplot, ANOVA 검정 3) c,n : logistic regression 4) c,c : bar plot, x^2 검정(독립성/동질성 검정) Multivariate 1) n,n,n,... : scatter plot matrix 2) c,c,c,..
2019.10.30 -
3. 자료의 유형과 사례연구
SNUON 통계학 강의 + 학교 수업내용 일부 3-1 수치형 자료 Numerical Data 1. Scatterplot(산점도) : 수치형 데이터 사이의 관계를 시각적으로 보여주는데 유용하다 2. Dot Plot : 하나의 수치형 데이터의 시각화에 효과적이다. 진한 색깔은 관측치가 보다 많은 부분을 나타낸다 3. Stacked Dot Plot : 색깔로 관측치의 개수를 표현하는 대신 관측치를 그 위치에 개수만큼 쌓아 놓는 방식으로 표현한다 4. Histogram : 자료의 밀도를 나타내는데 사용한다. binwidth에 따라 자료의 형태가 달라질수 있음에 유의 cf) Stacked Dot Plot과의 차이점 : 모든 데이터가 아니라, 구간을 정해서 그 구간의 데이터를 나타냄 5. Box Plot : Q1,..
2019.10.28 -
칸 아카데미로 딥러닝을 위한 수학 공부하기 | Vectors
스탠포드 자연어 처리 강의 CS224n: Natural Language Processing with Deep Learning (http://web.stanford.edu/class/cs224n/) 를 듣고 싶었는데, 들으려면 이 4가지 조건이 우선 만족되어야 한다. 1. 파이썬 2. 미적분, 선형대수 3. 기초 확률과 통계 4. 머신러닝에 대한 기초적 이해 파이썬은 할 줄 알고, 머신러닝 개념은 대충 주워들은게 있다고 해도. 미적분, 선형대수 등 수학은 배운 적 없다! 이렇게 딥러닝에 필요한 수학을 공부할 때 많이들 추천하는 칸 아카데미! (https://ko.khanacademy.org) 머신러닝에 필요한 수학을 칸 아카데미로 공부하려는데 어떨까? 라는 질문에 달린 답변들 머신러닝/데이터 사이언스를 위..
2019.10.28 -
2. 자료 수집
SNUON 통계학 강의 2.1. 자료 수집 개요 [모집단(Population)과 표본(Sample)] 연구질문: 대서양에 서식하는 황새치 몸에 있는 평균 납 함유량은? Target population: 대서양에 서식하는 모든 황새치 Sample: 연구를 위해 잡힌 황새치 → 만약 sample이 randm하게 뽑혔다면 sample에서 채취한 평균 납 함유량에 대한 결과를 전체 모집단으로 확대할 수 있다. [일회성 증거(Anecdotal evidence)] 일회성 증거는 모집단을 대표한다고 얘기하기 힘들다 ex) 우리 삼촌은 하루 담배를 두 갑씩 피우지만 건강에 전혀 문제가 없다 [Census] Census : 표본을 선택하는 대신 전체 모집단에 대해 조사하는 경우 * 센서스의 문제점 - 센서스에 잡히지 않..
2019.10.21