AI
ML : Machine Learning 개념과 종류 : 모형의 적합성 평가 및 실험 설계
월곡동로봇팔
2020. 3. 7. 12:42
모형의 적합성을 평가하는 방법
학습을 시킬 때 변수의 갯수에 따라 학습데이터의 성능과 검증데이터의 성능을 항상 비교해야 한다.
데이터 분할
data 분할은 항상 training, valiadation, test 로 세 가지를 나눠서 검증해야한다.
2020/02/01 - [machine_learning/ML] - ML&DL : train, validation, test 데이터로 나누기
ML&DL : train, validation, test 데이터로 나누기
code - 1 import sklearn def data_split(examples, labels, train_frac, random_state=None): ''' https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html param dat..
mambo-coding-note.tistory.com
k-fold 교차 검증 (cross-valiation)
- data를 k개 부분으로 나눈 뒤, 그 중 하나를 validation, 나머지를 training
- 위 과정을 k번 반복하여 k개의 성능지표를 평균하여 모형의 적합성을 평가
LOOCV (Leave-One-Out Cross Validation)
- data의 수가 적을 때 사용하는 교차검증 방법
- 총 n개의 모델을 만들 때, n개로 data를 나눠 하나씩 빼고 training을 하고, 뺀 부분으로 검증을 한 후, 성능을 평균 내는 model -> Ensemble Learning과 흡사한 개념