본문 바로가기
대학원 공부/programming language

Pandas : DataFrame vs Series

by 월곡동로봇팔 2020. 2. 4.

차이점

우선! Series 는 DataFrame의 요소 중 하나라고 생각하면 된다. 즉 여러 개의 Series가 모여서 하나의 DataFrame이 만들어진다고 생각하면 된다.

DataFrame vs Series

위의 그림은 DataFrame과 Series의 차이점을 보여주려고 한다.

 

우선 DataFrame에서 DataFrame으로 뽑아내려면 [[]] 이중괄호를 해서 type을 DataFrame으로 해주어야한다.

Series를 추출하려면 [] 하나만 적용해서 type을 Series로 하면 된다.

target = boston[['Target']]
-> pandas.core.frame.DataFrame

target = boston['Target']
-> pandas.core.series.Series

예시

밑의 그림은 DataFrame과 Series를 list로 타입 변환을 하였을 때의 결과값들이다.

DataFrame vs Series

Series를 정의할 때, value로 list를 넣을 수 있기 때문에 Series와 list끼리는 변환이 가능하다.

But! DataFrame을 정의할 때는 Series를 넣거나, list에 columns의 name을 정해주어야 하기 때문에 list에 DataFrame을 넣으면, 출력내용은 column의 값이 나온다.

 

적용

나라면 이렇게 쓸 것이다.

  • Series는 머신러닝에서 DataFrame에 있던 x변수들의 값들을 다른 변수에 옮길 때 사용할 것 같다.
  • DataFrame은 머신러닝에서 list안에 DataFrame안에 넣고 columns들의 값을 뽑아낼때 사용할 것 같다.

https://yganalyst.github.io/study/Pd_1/

 

[Pandas 1] 시리즈(Series)와 데이터프레임(Dataframe)

판다스의 기본 자료구조인 시리즈와 데이터프레임을 알아보자

yganalyst.github.io

댓글