확률, 확률변수, 확률함수, 확률분포란?
확률 : 경험 혹은 실험의 결과로 특정사건이나 결과가 발생할 가능성
확률의 조건
1. Random Process : 어떤 결과들이 발생하는지는 알지만 그 중 어떤 결과가 나올지는 알 수 없다.
2. Mutually Exclusive Outcomes : 동시에 두가지 사건이 발생 할 수 없다.
3. Law of Large Numbers : 시행 회수를 많이 할수록 특정 결과가 발생할 비율은 자체의 가능성에 점점 수렴한다.
4. Independence : 한 시행의 결과가 다른 시행의 결과에 영향을 주지 않는다.
표본 공간 : 실험 결과 발생 할 수 있는 모든 가능한 결과의 집합
확률 변수 : 확률실험의 결과를 실수에 대응시키는 함수 (표본공간상의 모든 가능한 결과에 특정 수치를 부여하는 것)
EX1. Z = 임의의 점 A에서 원점까지의 거리(연속확률변수)
EX2. 두 개의 주사위 던지기/ 표본 공간 : (1,1), (1,2) ...(6,6)/ 이산확률변수 : 두수의 합, 두수의 차, 1의 개수 ...
확률 함수 : 확률변수에 대하여 정의된 실수를 0과 1 사의의 실수(확률)에 대응시키는 함수
실험 표본 공간 → 확률 변수 → 실수 공간 → 확률 함수 → 확률
확률 분포 : 확률변수가 특정 값을 가질 확률, 즉 상대적 가능성을 나타냄/ 모든 가능한 확률변수 값과 그 값이 발생할 확률 값을 도수분포표나 그래프로 나타낸 것
2.1 확률모형이란?
앞서 확률은 불확실성을 표현하는 수단이라고 했는데, 이러한 불확실성을 확률로써 계량화하기 위해 우리가 앞서 다룬 확률함수로써 수학적으로 만든 모형이 바로 확률모형입니다. 그리고 함수에 쓰인 계수들을 모수(parameter)라고 부릅니다. 통계학에서 모수를 추정한다는 말을 많이하곤 하는데, 바로 현재 갖고 있는 데이터의 분포를 알고자하는 일이 모수를 추정하는 것입니다. 확률분포를 안다고 함은 확률분포를 나타내는 확률분포함수를 안다는 것이고, 확률분포함수를 안다는 것은 함수식을 구성하는 parameter를 안다는 것입니다. 따라서, 어떤 확률변수의 분포를 안다는 것은 매우 의미있는 정보를 얻는 것이라고 할 수 있습니다. 분포를 알면 어떤 X값이든 그 X가 발생할 확률을 얻을 수 있습니다. 그래서 모수를 추정하는 많은 방법론들을 통계학에서 연구하고 발전시켰습니다. (출처 : https://sumniya.tistory.com/24)
현재 갖고 있는 데이터의 분포를 알고자하는 일이 모수를 추정하는 것. 확률분포를 알면 확률분포를 나타내는 확률분포함수를 알고, 확률분포함수를 알면 함수식을 구성하는 parameter를 안다는 것. 어떤 확률변수의 분포를 안다는 것은 매우 의미있는 정보를 얻는 것. 분포를 알면 어떤 X값이든 그 X가 발생할 확률을 얻을 수 있음
연속 확률분포 : 정규분포, t분포, 카이분포, F분포, 와이블 분포 ...
이산 확률분포 : 베르누이 분포, 이항 분포, 포아송 분포, 초기하 분포 ...