차이점
우선! Series 는 DataFrame의 요소 중 하나라고 생각하면 된다. 즉 여러 개의 Series가 모여서 하나의 DataFrame이 만들어진다고 생각하면 된다.
위의 그림은 DataFrame과 Series의 차이점을 보여주려고 한다.
우선 DataFrame에서 DataFrame으로 뽑아내려면 [[]] 이중괄호를 해서 type을 DataFrame으로 해주어야한다.
Series를 추출하려면 [] 하나만 적용해서 type을 Series로 하면 된다.
target = boston[['Target']]
-> pandas.core.frame.DataFrame
target = boston['Target']
-> pandas.core.series.Series
예시
밑의 그림은 DataFrame과 Series를 list로 타입 변환을 하였을 때의 결과값들이다.
Series를 정의할 때, value로 list를 넣을 수 있기 때문에 Series와 list끼리는 변환이 가능하다.
But! DataFrame을 정의할 때는 Series를 넣거나, list에 columns의 name을 정해주어야 하기 때문에 list에 DataFrame을 넣으면, 출력내용은 column의 값이 나온다.
적용
나라면 이렇게 쓸 것이다.
- Series는 머신러닝에서 DataFrame에 있던 x변수들의 값들을 다른 변수에 옮길 때 사용할 것 같다.
- DataFrame은 머신러닝에서 list안에 DataFrame안에 넣고 columns들의 값을 뽑아낼때 사용할 것 같다.
'대학원 공부 > programming language' 카테고리의 다른 글
Numpy : np.reshape, flatten, ravel, newaxis (차원 변경) (0) | 2020.02.21 |
---|---|
Python : decorater @ (0) | 2020.02.20 |
Pandas : DataFrame.difference (0) | 2020.02.04 |
Pandas : DataFrame axis (0) | 2020.02.04 |
Pandas : DataFrame에서 [[]], .(param) 다른점 (0) | 2020.02.03 |
댓글