본문 바로가기
AI

Statistics : 6-1, 6-2 : 확률분포 : 확률변수

by 월곡동로봇팔 2020. 1. 2.

확률변수 (random variable)

 

정의

> 각각의 근원사건들에 실숫값을 대응시키는 함수이며, X, Y .... 등등으로 표시한다.
> 즉, 어떤 사건이 일어났을 때, 각각 근원사건들을 우리가 원하는 상황에 맞춰 실수값으로 대응시키는 것을 말한다. (근원사건 -> 실수값)

예시-1

ex ) 승용차를 소유하고 있는 사람들 중에서 임의로 3명은 선택, 어느 회사에서 만든 승용차를 가지고 있는지를 물어보는 실험을 하였다. 편의상 이들은 모두 A와 B 회사 제품 중 하나를 가지고 있다고 가정하자. 이 때 3명 중에서 A회사 제품을 가지는 사람의 수를 X라고 할 때, X가 확률변수이다.

X라는 확률변수가 여러가지 경우의 수 중, A회사를 가지는 사람의 수라는 상황에 맞춰 실수값에 대응시키기 때문에, X를 확률변수라고 한다.

실험을 하기전까지는 X가 어떤 값을 갖게 될지 확실히 알 수 없기에 X는 하나의 확률변수가 된다.

 

실험의 결과 (근원사건) 대응되는 X 값
AAA 3
AAB 2
ABA 2
BAA 2
ABB 1
BAB 1
BBA 1
BBB 0

한편 하나의 근원사건에는 오직 하나의 X값에 대응되며 여러 개의 근원사건에 같은 X값이 대응될 수도 있다.

각 X값에 대응되는 근원사건들의 모임은 하나의 사건을 이루며 각기 다른 X값에 대응되는 사건들은 서로 배반사건이 된다.

확률변수 X의 값 각 X 값에 대응되는 사건
0 {BBB}
1 {ABB, BAB, BBA}
2 {AAB, ABA, BAA}
3 {AAA}

 

확률변수들의 종류

  • 이산확률변수 : 확률변수가 가질 수 있는 값의 개수를 유한적으로 셀 수 있는 경우
  • 연속확률변수 : 확률변수가 가질 수 있는 값의 개수를 유한적으로 셀 수 없는 경우, 연속적인 경우

확률분포 (probability distribution)

 

정의

> 확률변수가 갖는 값들과 그에 대응하는 확률값을 나타내는 것으로 나열된 표나 수식으로 표현된다. 보통은 확률변수 X의 분포 라고 한다.

예시-2

확률변수 X의 값 각 X 값에 대응되는 사건
0 1/8
1 3/8
2 3/8
3 1/8

위의 예시를 확률분포로 나타낸 것이다.

 

일반적으로 확률변수 X가 k개의 값 x1, x2, ---- xk를 가질 때, 그에 대응하는 확률을 f(x1), f(x2) --- f(xk)라고 하면,

이를 일반화하면 X의 확률분포는 다음과 같다.

 

X가 취하는 값 (x) 확률 f(x)
x1 f(x1)
x2 f(x2)
----- -----
xk f(xk)

 

  • f(x)는 확률변수 X가 값 x를 갖게되는 확률 P(X=x) 를 나타내야한다. 
  • 확률의 기본법칙에 따라 0~1사이의 값을 가져야한다. // 0 ≤ f(xi) ≤ 1
  • 모든 x값에 대하여 그 합이 1이어야 한다. // ∑f(xi) = 1
  • f(x)를 확률함수 or 확률질량함수라고 한다.

 

댓글