all(408)
-
밑바닥부터 시작하는 딥러닝 1권 : Chapter 5-6 [오차역전파법 및 학습] 2019.12.27
-
밑바닥부터 시작하는 딥러닝 1권 : Chapter 2-4 [퍼셉트론과 신경망] 2019.12.24
-
데이터 읽기의 기술
점점 성별과 나이의 구분이 무색해지고 있다. 그래서 오히려 개인의 성향에 맞춘 추천, 혹은 행동 속성에 따른 군집화가 적합하다. 특정 기준을 가지고 고객을 집단화하는 것이다. 과거엔 모두에게 광고를 뿌리고spray 그것이 원하는 고객에게 전달되기만을 바라는pray 방식이었다. 이제는 개인이 볼 수 있는 웹이나 앱 플랫폼에서 그들에게 적합한 정보를 제공한다. 광고 비용의 효율화뿐만 아니라, 구매 가능성을 높인다는 데 방점이 찍히는 것이다. 맞춤형 추천 알고리즘 1) 사람 간의 유사성 계산 - A가 구매한 목록과 B가 구매한 목록이 비슷하다면, A는 샀지만 B가 아직 사지 않은 것을 B에게 추천하기 2) 상품 간의 유사성 계산 (사람보다 상품 수가 적으니 더 빨리 계산 가능) - A 상품을 산 사람과 B 상..
2019.12.20 -
9. Resampling과 가설검정
SNUON 통계학 9-1. Resampling (Bootstrap) Resampling - 신뢰구간을 유도하는 과정은 중심극한정리에 의존한다 - 만약 우리가 분산, 혹은 변동계수 (표준편차 ÷ 평균)의 신뢰구간을 구하고 싶다면 어떻게 해야 할까? - 방법 1 : 분산(변동계수)의 추정치인 표본분산 (표본 변동계수) 를 구한 후 추정치의 sampling distribution을 이론적으로 계산한 후 이를 바탕으로 신뢰구간을 구한다 - 방법 2 : 방법 1과 같은 방식을 사용하지만 sampling distribution을 bootstrap을 사용해 구한다 - 이론적으로 sampling distribution을 알 수 없다면 어떻게 sampling distribution을 알아낼 수 있을까? - 만약 우리가 ..
2019.12.18 -
8. 통계적추론의 개요
SNUON 통계학 8-1. 표본분포 통계적 추론 - 지금까지는 평균, 특정 사건이 나타날 확률 등이 주어져있고 이를 통해 계산함 - 하지만 실제 세계에서 평균이나 확률을 정확히 알긴 어려움. 이러한 값을 추정하는 것이 통계적 추론 추정 - 우리는 데이터를 통해 모집단의 모수(population parameter)를 알아내고자 한다 - 예를 들면 모집단이 정규분포를 따른다면 모집단의 평균과 표준편차만 알면 모집단에 대한 대부분의 정보를 아는 것이다 - 일반적으로 모집단 전체를 자료로 모으는 것은 거의 불가능하므로 우리는 모집단의 일부를 sampling을 통해 표본으로 얻은 후에 표본 통계량(sample statistic)을 이용해 모집단의 모수를 추정한다. - 데이터가 어떤 분포를 따르는지 알고, 그 분포..
2019.12.18 -
7. 다양한 이산분포
SNUON 통계학 7-1. 이항분포 밀그램 실험 4명의 피실험자 A,B,C,D 중 정확히 1명이 볼트를 최고전압으로 올리는 걸 거부할 확률은? A가 거부한 경우의 확률 + B가 거부한 경우의 확률 + C가 거부한 경우의 확률 + D가 거부한 경우의 확률 이항분포 - 이 경우 4가지 확률의 합이 질문의 답이다 - 이처럼 n개의 베르누이 시행에서 k개의 성공횟수를 나타내는 확률변수의 분포를 이항분포라고 한다 - 이항확률분포의 확률밀도함수는 * 이항계수 = nCk (조합) 이항분포의 평균 E(X) = np (시행횟수 * 확률) 이항분포의 분산 Var(X) = np(1-p) 예제 : 갤럽의 비만도 조사 국가주요지표 홈페이지에 의하면 2016년 한국인의 34.8%가 비만이다. 100명의 한국인을 임의로 뽑았을 때..
2019.12.18