본문 바로가기

분산2

ML : Ensemble Learning : RandomForest 정의 2020/01/02 - [machine_learning/statistics] - Statistics : 6-6 : 확률분포 : 공분산과 상관계수 Statistics : 6-6 : 확률분포 : 공분산과 상관계수 공분산 (확률변수에서 적용) 정의 > 두 개의 확률변수 X, Y가 상호 어떤 관계를 가지며 변화하는가를 나타내주는 척도로서 (X-μx)(Y-μy).의 기댓값으로 정의된다. > Cov(X, Y) = E[(X-μx)(Y-μy)] = E(.. mambo-coding-note.tistory.com 공분산은 두 개의 class들이 서로 얼마나 상관관계가 있는지 치수로 보여준다. E[(X-μx)(X-μy)] 독립일 때는 서로 상관관계가 존재하지 않는다. Bagging을 복원추출하기 때문에 각각의 트리들을.. 2020. 2. 20.
Statistics : 3-3 : 분산, 표준편차 분산(variance), 표준편차 (Standard Deviation) 배경 2019/12/21 - [ML/statistics] - Statistics : 3-2 : 평균값, 중앙값, 최빈값 Statistics : 3-2 : 평균값, 중앙값, 최빈값 평균값 정의 ∑(데이터) / (데이터의 총 갯수)로 나누기해서 얻은 값이다. ∑ (계급값 * 상대도수) 배경 도수분포표나 히스토그램은 몇 가지 단점들을 가지고 있다. 만든 사람의 생각이 들어가니, 실제로 표.. mambo-coding-note.tistory.com 우리가 위에 포스팅에서 통계량은 데이터들이 어떠한 특성을 가지고 있는지, 평균값, 표준편차를 이용해 수치적으로 정한다고 배웠다. 또한 평균값의 특성상 "평균값은 data들이 평균값 주위로 분포해있다.. 2019. 12. 21.