확률 변수 랜덤 변수 일정한 확률 발생하는 사건, 사상 수치가 부여되는 함수. 변수가 아닐 ㅏ함수임. 대문자 엑스 엑스가 피의 확률로 엑스의 값으 ㄹ가진다. 엑스가 피의 확률로 엑스의 값을 가진다. 확률 변수 엑스가 가질 수 있는 값의 범위가 이산확률변수, 연속확률 변수로 나뉜다. 기초적인 통계학의 경우 실제 계산하는 것보다 확률 변수, 확률 분포, 기댓값 등의 개념을 이해하는 것이 중요함 이산 확률 변수 확률 확률 변수 엑스가 취할 수 있는 모든 값을 엑스1, 엑스2, 엑스3, 처럼 셀수 있을 때 엑스를 이산 확률 변수라고 함 랭크 게임 승률, 자유투 성공률을 모르더라두 위의 두 변수는 확률 변수임. 경우에도 위 횟수는 이산확률 변수임. 물론 가능한 갯수가 너무 많은 경우는 그냥 연속확률변수처럼 다룰 수도 있음 보통 이런 식으로 개수를 나타내는 확률변수가 많지만, 실수값을 지니더라도 가능한 값이 유한 가지 뿌닝면 그것도 역시 이산확률변수라 함. 광주리에서 토마토를 하나 집어들었을 때 그 토마토의 무게 같은 것도 이산확률 변수임 연속확률 변수 적절한 구간 내의 모든 값을 취하는 확률 변수 핸드폰으로 나무위키를 보는 사람이 일요일에 나무위키를 본 시간은 셀 수 없음. 1초 2초와 같이 셀 수 있는 것처럼 보이기도 하나, 실제로는 딱 떨어지지 않음. 따라서 연속화률변수는 확률분포함수를 도입하며, 에이에서 비까지 적분함으로써 확률변수의 에이와 비 사이에 있을 확률을 구함. 가장 유명하면서 대표적인 연속 확률 변수의 확률 분포는 정규분포임 |
베이즈 정리 조건부 확률에 대한 수학적 정리임 사건 에이와 비가 있을 때, 사건비가 일어난 것을 전제로 한 사건 에이의 조건부 확률을 구하고 싶음. 베이즈 정리의 두 가지 맥락 3.1 역확률 문제 베이즈 정리 본래 역확률 문제 해결하기 위한 방법. 조건부 확률을 알고 있을 때, 전제와 관심 사건이 관계가 정반대인 조건부 확률을 구하는 방법 우리가 검사 대상인 질병의 유병률을 알고 있다면, 베이즈 정리를 통해 역확률을 계산할 수 있음. 전세계 인구 중 1% 정도의 사람들이 병 아이를 앓는다고 알려져 있다고 가정. 검사 결과가 양성으로 나온 사람이 병 아이를 앓고 있을 확률은 약 8% 임. 3.2 데이터를 이용한 사후확률의 추정 베이즈 정리를 역확률 문제가 아니라, 이전 경험과 현재의 증거를 토대로 어떤 사건의 확률을 추론하는 알고리즘으로 보고 관심을 가지는 사람들 있음. 어떤 사건이 일어날 확률에 대한 임의의 가정 P(A)에 실제로 발견된 자료나 증거를 반영해서, 활용 베이즈 통계학(베이지언 통계학) 베이즈 통계학 수후 확률을 추론하는 방식 베이즈 정리. 통계학 문제 접근 흐름 기존의 믿음에 자료 반영 베이즈 정리 확률 추정 관점 기존 통계학. 사전분포와 가능도가 특정한 짝을 이루고 있다면, 추출되는 사후분포는 사전분포와 동일한 혇ㅇ태를 가짐. 사전분포를 공액사전 분포 또는 켤레사전분포라 함. 사전분포와 가능도가 모두 정규분포를 따른다면 사후분포는 사전분포와 동일한 정규분포가 됨. 사전분포와 가능도가 각각 베타분포와 이항분포를 따른다면, 사후분포는 사전분포와 동일한 베타분포가 됨. 하지만 현실에서 발생하는 데이터들은 항상 이렇게 사전분포와 가능도가 잘 매칭되지 않는 경우가 대부분이라는 것이 문제임. 사람의 손으로 사후분포를. 베이즈. 베이즈 주의의 관점에서 데이터 분석하는 것이 훨씬 쉽게 되었음 5.2 인지과학 및 인공지능에서의 베이즈 정리 베이즈 정리 인간이 생각하고 판단하는 근본적인 방식. 이론적인 흐름 낳기도 함 인간의 사고는 처음에는 아무 정보가 ㅇ벗던 상태 새로운 정보 받아들임 |
조건부 확률 사건 비가 일어나는 경우에 사건 에이가 일어날 확률을 말함. 사건 비가 일어나는 경우에 사건 에이가 일어날 확률은. 오케이 예시가 되게 좋다 에어컨이 없는 중고차 중 시디 플레이어도 없을 확률은? 에어컨이 없을 확률, 시디 플레이어가 없을 확률, 에어컨과 시디 플레이어가 모두 없을 확률 = 0.1 |
최대 우도 추정법 항아리 안에 검은 구슬, 흰 구술 100개 구슬, 10번 구슬 추출 검은 구술 4번 흰 구슬이 6번. 항아리에 검은 구슬이 몇개 있었을까요? 최대 우도 추정법. 항아리 내 구성 상태를 표현하는 변수는 딱 하나면 됨. 목격한 사건이 확률적으로 일어난 사건으로 생각함. 첫 번째 구슬을 꺼낸 사건이 두 번째 구슬을 꺼낼 때 영향을 끼치지 않을 것임 10번 중 4번 검은 구슬 나오는 경우가 많음... 이것의 가짓수는 10컴비4라고 보면 됩니다. 구슬을 10번 꺼냈을 때, 4개의 검은 구슬, 6개의 흰 구슬을 목격할 확률은 얼마인가 세번만 보고, 왜 자주 만났을 것이라고 생각? 그들의 데이트 사건은 흔한 일이므로 본인이 목격할 수 있었다고 생각하기 때문. 흔한 사건 = 빈도가 높은 사건 = 발생 확률이 높은 사건 구슬을 10번 꺼냈을 때, 4개의 검은 구슬, 6개의 흰 구슬을 목격할 확률 을 계산함 목격한 사건 = 흔한 사건 = 빈도가 높은 사건 = 발생 확률이 높은 사건 항아리 안의 구성 상태를 의미하는 피스타는 우리가 목격한 사건들이 발생활 확률을 가장 높게 만드는 피이다. 곱하기가 더하기가 되기 때문에, 로그를 씌워서 계산함. 그리고 엑스가 크면 와이도 커짐. 함수. 미분 해서 0이되면 그때의 최대값을 찾을 수 있음. 이때의 피는 이렇게 계산됨. 로그를 씌우고, 미분을 해서 최대값을 찾으면 됨 항아리 피는 4/10 가 됩니다. 이렇게 설명할 수 있음 피 = 검은 구슬 수/전체 구슬 수 피 스타 = 4/10. 논리적으로 합당하다. 최대 우도 추정법으로 추정 할 수 있다 1. 모델을 설정함 2. 모델에서 본인이 목격한 사건들의 발생확률 식을 설정함 3. 그 확률을 최대로 높이는 모델 변수를 구함 당신이 목격한 사건의 발생확률을 최대로 높이는 모델 변수를 찾는 것. 1. 모델을 설정함 2. 모델에서 본인이 목격한 사건들의 발생 확률 식을 설정함 3. 그 확률을 최대로 높이는 모델 변수를 구함 |
Binomial Distribution 가정하는 것은 무엇인가 독립적인 이벤트임 동일한 확률 분포를 가지고 트라이얼 해봤음
압정의 결과는 세타의 확률 분포를 따른다. 이 가설을 어떻게 참이라고 말할 수 있을까요 맥시멈 라이클리 후드라는 추론입니다. 관찰된 데이터의 확률을 최대화 하는 세타를 찾아내는 것입니다. 그것을 세타 햇이라고 부르겠음 아규맥스 읽는 법 데이터를 관측할 확률을 최대화 할 세타를 찾아내자. 그리고 그 세타를 세타 햇이라고 하겠음 이제 maximaization 문제가 됩니다. 이 수식을 최대화 시켜주는 것이 되겠음 시간이 남아서 50번 던져봤더니, 정확히 30번 헤드 20번 테드가 나옴 그럼 5번 던져서 나온거랑 50번 던져서 나온거랑 동일한건가? 예 똑같이 0.6 입니다 ㅋㅋ 다른 것은 무엇인가요. 심플 에러 바운드라는 개념이 들어감니다 세타 햇입니다. 파라미터에 대해 추론을 한 것입니다. 에러가 줄어 든다는 것임니다. 추론한 세타 햇과 진짜 트루 파라미터의 차이가 특저 에러바운드 보다 클 확률은 이것보다는 작음 MLE 를 활용한 PAC learning 의 결과물이 되는지 알아봄 MLE 관점에서 세타를 추정함 다른 관점에서 세타를 추정해보도록 하겠음 |
'Computer Science' 카테고리의 다른 글
온라인 쥬스 나누기 (0) | 2018.11.14 |
---|---|
Week 1 Motivations and Basics Lecture 3 MAP (0) | 2018.11.13 |
집합과정 프리랜서 (0) | 2018.11.12 |
집합과정 Convex (0) | 2018.11.12 |
집합과정 무작위 행보 (0) | 2018.11.12 |
댓글