확률변수 (random variable)
정의
> 각각의 근원사건들에 실숫값을 대응시키는 함수이며, X, Y .... 등등으로 표시한다.
> 즉, 어떤 사건이 일어났을 때, 각각 근원사건들을 우리가 원하는 상황에 맞춰 실수값으로 대응시키는 것을 말한다. (근원사건 -> 실수값)
예시-1
ex ) 승용차를 소유하고 있는 사람들 중에서 임의로 3명은 선택, 어느 회사에서 만든 승용차를 가지고 있는지를 물어보는 실험을 하였다. 편의상 이들은 모두 A와 B 회사 제품 중 하나를 가지고 있다고 가정하자. 이 때 3명 중에서 A회사 제품을 가지는 사람의 수를 X라고 할 때, X가 확률변수이다.
X라는 확률변수가 여러가지 경우의 수 중, A회사를 가지는 사람의 수라는 상황에 맞춰 실수값에 대응시키기 때문에, X를 확률변수라고 한다.
실험을 하기전까지는 X가 어떤 값을 갖게 될지 확실히 알 수 없기에 X는 하나의 확률변수가 된다.
실험의 결과 (근원사건) | 대응되는 X 값 |
AAA | 3 |
AAB | 2 |
ABA | 2 |
BAA | 2 |
ABB | 1 |
BAB | 1 |
BBA | 1 |
BBB | 0 |
한편 하나의 근원사건에는 오직 하나의 X값에 대응되며 여러 개의 근원사건에 같은 X값이 대응될 수도 있다.
각 X값에 대응되는 근원사건들의 모임은 하나의 사건을 이루며 각기 다른 X값에 대응되는 사건들은 서로 배반사건이 된다.
확률변수 X의 값 | 각 X 값에 대응되는 사건 |
0 | {BBB} |
1 | {ABB, BAB, BBA} |
2 | {AAB, ABA, BAA} |
3 | {AAA} |
확률변수들의 종류
- 이산확률변수 : 확률변수가 가질 수 있는 값의 개수를 유한적으로 셀 수 있는 경우
- 연속확률변수 : 확률변수가 가질 수 있는 값의 개수를 유한적으로 셀 수 없는 경우, 연속적인 경우
확률분포 (probability distribution)
정의
> 확률변수가 갖는 값들과 그에 대응하는 확률값을 나타내는 것으로 나열된 표나 수식으로 표현된다. 보통은 확률변수 X의 분포 라고 한다.
예시-2
확률변수 X의 값 | 각 X 값에 대응되는 사건 |
0 | 1/8 |
1 | 3/8 |
2 | 3/8 |
3 | 1/8 |
위의 예시를 확률분포로 나타낸 것이다.
일반적으로 확률변수 X가 k개의 값 x1, x2, ---- xk를 가질 때, 그에 대응하는 확률을 f(x1), f(x2) --- f(xk)라고 하면,
이를 일반화하면 X의 확률분포는 다음과 같다.
X가 취하는 값 (x) | 확률 f(x) |
x1 | f(x1) |
x2 | f(x2) |
----- | ----- |
xk | f(xk) |
- f(x)는 확률변수 X가 값 x를 갖게되는 확률 P(X=x) 를 나타내야한다.
- 확률의 기본법칙에 따라 0~1사이의 값을 가져야한다. // 0 ≤ f(xi) ≤ 1
- 모든 x값에 대하여 그 합이 1이어야 한다. // ∑f(xi) = 1
- f(x)를 확률함수 or 확률질량함수라고 한다.
'AI' 카테고리의 다른 글
Statistics : 7-2 : 베르누이 시행 (0) | 2020.01.04 |
---|---|
Statistics : 6-6 : 확률분포 : 공분산과 상관계수 (0) | 2020.01.02 |
Statistics : 5-5 : 독립사건 vs 배반사건 (0) | 2020.01.02 |
Statistics : 카이제곱분포 (0) | 2020.01.01 |
Statistics : 확률분포들의 서로 얽혀있는 구조 (0) | 2020.01.01 |
댓글