본문 바로가기
데이터 사이언스/Series와 DataFrame

Index 관련 특징 및 함수

by Engineer-Lee 2022. 7. 4.
반응형

index() : 인덱스를 새롭게 정의함

 

 

set_index() : 특정 column을 index로 만듦

 

 

reindex() : 새로운 index label을 기반으로 기존의 "index-value" mapping은 유지한채 재배열하는 것

 

 

nan값과 어떠한 값을 연산하면 그 결과는 nan이다.

 

인덱스는 값도 같고 데이터 타입도 같아야 한다.

현재 s2는 문자의 인덱스를 갖고 있지만 정수형의 인덱스로 reindex를 하게되면 숫자 0,1, 2에 맵핑된 값으로 바뀌게 된다.

그런데 숫자 0, 1, 2에 맵핑된 값이 없으므로 nan이 나오게 되는 것이다.

 

 

이 문제는 astype함수를 이용해서 해결할 수 있다.

또 다른 방법으로는 s1과 s2에 새롭게 같은 인덱스를 정의하는 것이다.

 

 

copy() : 똑같은 Series를 복사함

 

 

fill_value : 값이 없는 인덱스에 nan대신 지정한 값을 채워넣음

nan이 col에 생성되면 int형 값이 float로 변환된다.

 

 

method='ffill' : NaN값 대신 이전에 존재하는 값이 계속해서 대입됨

반응형

'데이터 사이언스 > Series와 DataFrame' 카테고리의 다른 글

reindex()을 이용하여 주가 데이터 수집하기  (0) 2022.07.04
DataFrame 데이터 타입  (0) 2022.07.04
Series 데이터 타입  (0) 2022.07.04
numpy 소개  (0) 2022.07.04