대표적으로 사용하는 연속 확률 변수에 대한 분포를 알아본다. 의미적으로 이해하는 것을 우선으로 한다.

감마 분포

a번째 사건이 발생할 때까지 걸리는 시간에 대한 분포

음이항 분포와 매우 비슷하다. 음이항 분포가 기하 분포의 결합으로 설명되었던 것처럼, 감마 분포도 지수 분포의 결합으로 설명되는 확률 변수에 대해 표현된다.

스튜던츠 t 분포

모분산을 모를 때, 표본에 대한 분포를 사용할 때 사용한다.

사실 t분포는 추정에서 보다 정확히 사용처를 알 수 있다. 일단은, 모평균이 이고, 모분산이 인 경우, 우리는 Z를 사용하여 이것이 표준 정규 분포를 따른다고 알고 있다.

그런데, 우리가 하는 행위는 표본을 통하여 모집단을 예측하는 행위를 하는 것이고, 그렇기 때문에 현실에서 하는 모든 행위는 모집단을 알 수 없다. 그렇기 때문에 평균은 알 수 있을 지라도 모분산을 모르기 때문에 내가 뽑은 표본의 분포가 정규 분포라 가정하고 추정을 수행할 수 없다.

이러한 문제에 대해 해결하기 위한 방법으로 모분산 대신 표본 분산을 사용하여 분포를 만들었다. 이것을 t 분포라 한다. 표본 분산을 구하는데에 있어서는 자유도가 필요하므로, t 분포를 사용하기 위해서는 자유도라는 매개변수가 필요하다.

자세한 내용은 스튜던트 t 분포 를 확인하자.

카이제곱 분포

정규 분포 랜덤 변수의 제곱의 합으로 표현되는 랜덤 변수에 관한 분포

왜 카이제곱 분포가 필요할까? 기본적으로 카이제곱 분포는 표본의 분산에 관련된 무언가를 만들기 위해 탄생한 분포이다. 실제로 표준 정규 분포의 랜덤 변수를 제곱하여 자유도 만큼 더한 것으로 카이 제곱 분포의 랜덤 변수가 정의된다. 해당 분포는 분산의 특징을 대변한다는 특징이 있다.

F 분포

두 확률 변수가 독립인 카이제곱 분포를 따른다고 할 때 다음의 랜덤 변수가 따르는 분포

가우시안 분포

이항 분포의 n이 늘어났을 때 근사하는 분포

가장 중요한 분포이며, 평균과 표준편차를 매개변수로 갖는 분포이다.