4. 확률이란?

2019. 10. 31. 10:19stats

반응형

SNUON 통계학 강의

4-1. 확률의 정의

 

1. 확률의 정의

 

Kolmogorov's Axioms

"P(A) = 사건 A가 일어날 확률"이라고 하면 확률은 다음의 공리를 따른다

1) 확률은 0과 1 사이에 있다.

2) P(가능한 무엇인가는 일어난다) = 1 (*전체 집합이 1이라는 의미)

3) 만약 사건 A와 B가 동시에 관측될 수 없다면 P(A or B) = P(A) + P(B)

 

확률의 정의

1) Frequentist : P(A) = lim (n→∞) # times A happens / n

- 동전 던지기와 같이 우리가 발생 가능한 사건(앞면/뒷면)을 모두 알고 있지만, 시행 후 어떤 사건이 발생할지 모르는 경우를 random process라고 한다.

- 어떤 사건이 일어날 확률은 random process를 반복적으로 시행했을 때 그 특정 사건이 발생하는 비율이다.

2) Bayesian

- 확률을 본인의 경험과 직관에 의존하여 결정한다. 단 이 경우에도 다른 경우에 대한 확률 정의와 일치해야 한다

- 새로운 자료를 수집할 경우 Bayes' rule에 따라 확률을 업데이트 한다

- Bayesian의 정의에 따르면 두 사람이 같은 사건에 대해 서로 다른 확률을 정의할 수 있다. 

- 확률은 분포에 따라 변할 수 있다 (ex) 야구선수의 타율이 매번 똑같지 않다 

- 사전확률과 사후확률 (주관적 사전확률, 그러나 데이터가 쌓이면 사후확률은 비슷해짐)

 

Law of Large Numbers 

- 관측치가 많아질수록 특정 사건이 일어나는 비율은 그 사건이 일어날 확률로 수렴한다.

 

Disjoint/Non-disjoint Events

1) Disjoint events : 같은 시간에 동시에 관측할 수 없는 사건

(ex) 동전의 앞면과 뒷면을 동시에 관측할 수 없다

2) Non-disjoint events : 같은 시간에 동시에 관측할 수 있다

(ex) 주사위를 던졌을 때 결과가 짝수인 경우와 소수인 경우(2)

 

Additional Rule 

사건 A 혹은 B가 발생할 확률은 P(A or B) = P(A) + P(B) - P(A and B)

 

Sample Space (표본공간)

- 일어날 모든 가능한 사건의 집합

 

(Discrete) probability distribution (이산형 확률 분포)

- 가능한 모든 사건에 대해서 그 사건이 일어날 확률을 표현한 것

(ex) 혈액형

A B AB O
34% 27% 11% 28%

Independence

- 한 사건이 일어나는 경우가 다른 사건이 일어나는 경우에 영향을 미치지 않은 경우 두 사건은 독립

cf. Disjoint event

(ex) 주사위 2개를 던질 때 하나의 주사위에서는 짝수, 다른 주사위에서는 홀수가 관측되는 경우

 

Multiplication Rule

사건 A와 B가 독립이면 P(A and B) = P(A) * P(B)

 

4-2. 조건부확률의 소개 

 

예제: 자녀와 부모의 대학졸업 여부

  부모 졸업O 부모 졸업X 합계
자녀 진학O 231 214 445
자녀 진학X 49 298 347
합계 280 512 792

P(부모 졸업) = 280/792  → Marginal Probability

P(부모 졸업&자녀 진학) = 231/792   Joint Probability

P(자녀가 진학한 경우 부모가 졸업) = 231/445   Joint Probability

 

조건부 확률 = P(A|B) = P(A ∩ B) / P(B)

사건 B가 관측된 후에 사건 A가 일어날 확률은 사건 B가 주어진 경우 사건 A의 조건부 확률(Conditional Probability of A given B)

 

[연습문제 1] 자녀가 2명. 한 명이 아들이라는 사실을 알고 있을 때 다른 한명이 아들일 확률?

 

사건 B를 2명의 자녀 중 1명이 아들인 경우라고 하면, 표본 공간은 (아들,딸), (딸,아들), (아들,아들) 이다.

사건 A를 2명이 모두 아들인 경우라고 하면 (아들,아들)

구하고자 하는 확률은 P(A|B) = 1/3

 

 

[연습문제 2] Monty Hall Problem. 3개의 문 중 1개의 문 뒤에만 자동차. 참가자가 2번문 선택했을 때, 진행자는 남은 2개의 문 중 하나를 열어 문 뒤에 아무것도 없음을 보여줌. 참가자는 선택을 바꾸는 것이 유리한가?

 

sample space S = {(w1, w2) | w ∈ (1,2,3) } 라 정의하고 w1은 자동차가 있는 문, w2는 참가자가 처음 선택하는 문

S = {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3) } 이다. 총 9가지 

선택을 바꾸지 않을 경우 당첨될 경우는 (1,1), (2,2), (3,3)으로 3가지 경우. 따라서 당첨 확률은 1/3 

선택을 바꾸고 당첨될 확률은 2/3

반응형

'stats' 카테고리의 다른 글

6. 확률분포  (0) 2019.11.16
5. 조건부 확률과 확률변수  (0) 2019.11.11
자료 유형에 따른 시각화 방법  (0) 2019.10.30
3. 자료의 유형과 사례연구  (0) 2019.10.28
2. 자료 수집  (0) 2019.10.21