2019. 10. 31. 10:19ㆍstats
SNUON 통계학 강의
4-1. 확률의 정의
1. 확률의 정의
Kolmogorov's Axioms
"P(A) = 사건 A가 일어날 확률"이라고 하면 확률은 다음의 공리를 따른다
1) 확률은 0과 1 사이에 있다.
2) P(가능한 무엇인가는 일어난다) = 1 (*전체 집합이 1이라는 의미)
3) 만약 사건 A와 B가 동시에 관측될 수 없다면 P(A or B) = P(A) + P(B)
확률의 정의
1) Frequentist : P(A) = lim (n→∞) # times A happens / n
- 동전 던지기와 같이 우리가 발생 가능한 사건(앞면/뒷면)을 모두 알고 있지만, 시행 후 어떤 사건이 발생할지 모르는 경우를 random process라고 한다.
- 어떤 사건이 일어날 확률은 random process를 반복적으로 시행했을 때 그 특정 사건이 발생하는 비율이다.
2) Bayesian
- 확률을 본인의 경험과 직관에 의존하여 결정한다. 단 이 경우에도 다른 경우에 대한 확률 정의와 일치해야 한다
- 새로운 자료를 수집할 경우 Bayes' rule에 따라 확률을 업데이트 한다
- Bayesian의 정의에 따르면 두 사람이 같은 사건에 대해 서로 다른 확률을 정의할 수 있다.
- 확률은 분포에 따라 변할 수 있다 (ex) 야구선수의 타율이 매번 똑같지 않다
- 사전확률과 사후확률 (주관적 사전확률, 그러나 데이터가 쌓이면 사후확률은 비슷해짐)
Law of Large Numbers
- 관측치가 많아질수록 특정 사건이 일어나는 비율은 그 사건이 일어날 확률로 수렴한다.
Disjoint/Non-disjoint Events
1) Disjoint events : 같은 시간에 동시에 관측할 수 없는 사건
(ex) 동전의 앞면과 뒷면을 동시에 관측할 수 없다
2) Non-disjoint events : 같은 시간에 동시에 관측할 수 있다
(ex) 주사위를 던졌을 때 결과가 짝수인 경우와 소수인 경우(2)
Additional Rule
사건 A 혹은 B가 발생할 확률은 P(A or B) = P(A) + P(B) - P(A and B)
Sample Space (표본공간)
- 일어날 모든 가능한 사건의 집합
(Discrete) probability distribution (이산형 확률 분포)
- 가능한 모든 사건에 대해서 그 사건이 일어날 확률을 표현한 것
(ex) 혈액형
A | B | AB | O |
34% | 27% | 11% | 28% |
Independence
- 한 사건이 일어나는 경우가 다른 사건이 일어나는 경우에 영향을 미치지 않은 경우 두 사건은 독립
cf. Disjoint event
(ex) 주사위 2개를 던질 때 하나의 주사위에서는 짝수, 다른 주사위에서는 홀수가 관측되는 경우
Multiplication Rule
사건 A와 B가 독립이면 P(A and B) = P(A) * P(B)
4-2. 조건부확률의 소개
예제: 자녀와 부모의 대학졸업 여부
부모 졸업O | 부모 졸업X | 합계 | |
자녀 진학O | 231 | 214 | 445 |
자녀 진학X | 49 | 298 | 347 |
합계 | 280 | 512 | 792 |
P(부모 졸업) = 280/792 → Marginal Probability
P(부모 졸업&자녀 진학) = 231/792 → Joint Probability
P(자녀가 진학한 경우 부모가 졸업) = 231/445 → Joint Probability
조건부 확률 = P(A|B) = P(A ∩ B) / P(B)
사건 B가 관측된 후에 사건 A가 일어날 확률은 사건 B가 주어진 경우 사건 A의 조건부 확률(Conditional Probability of A given B)
[연습문제 1] 자녀가 2명. 한 명이 아들이라는 사실을 알고 있을 때 다른 한명이 아들일 확률?
사건 B를 2명의 자녀 중 1명이 아들인 경우라고 하면, 표본 공간은 (아들,딸), (딸,아들), (아들,아들) 이다.
사건 A를 2명이 모두 아들인 경우라고 하면 (아들,아들)
구하고자 하는 확률은 P(A|B) = 1/3
[연습문제 2] Monty Hall Problem. 3개의 문 중 1개의 문 뒤에만 자동차. 참가자가 2번문 선택했을 때, 진행자는 남은 2개의 문 중 하나를 열어 문 뒤에 아무것도 없음을 보여줌. 참가자는 선택을 바꾸는 것이 유리한가?
sample space S = {(w1, w2) | w ∈ (1,2,3) } 라 정의하고 w1은 자동차가 있는 문, w2는 참가자가 처음 선택하는 문
S = {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3) } 이다. 총 9가지
선택을 바꾸지 않을 경우 당첨될 경우는 (1,1), (2,2), (3,3)으로 3가지 경우. 따라서 당첨 확률은 1/3
선택을 바꾸고 당첨될 확률은 2/3
'stats' 카테고리의 다른 글
6. 확률분포 (0) | 2019.11.16 |
---|---|
5. 조건부 확률과 확률변수 (0) | 2019.11.11 |
자료 유형에 따른 시각화 방법 (0) | 2019.10.30 |
3. 자료의 유형과 사례연구 (0) | 2019.10.28 |
2. 자료 수집 (0) | 2019.10.21 |