[Pandas] row, column 처리
2015. 3. 16. 14:44ㆍProgramming/python
재색인
Pandas는 reindex라는 함수를 통해 기존 index를 새롭게 재배치 할 수가 있다.
'어?? 분명 Series 공부할 때, obj.index = ['a','b','c','d'] 이런식으로 index를 다르게 줬었는데.. 이건 왜 필요하지??'
분명 이전에 obj.index = ['a','b','c','d'] 이런 식으로 index 명칭을 변경했었다. 하지만 이건 재색인이라기 보다는 그냥
단지 index의 명칭을 기존 명칭에서 ['a','b','c','d']로 바꾼 것 뿐이다.
reindex에 대한 예제 코드를 본다면 위의 기능과 크게 다른 것임을 느끼게 될 것이다.
reindex를 통해 index에 해당하는 값들이 재배치된 것을 확인할 수 있을 것이다. 또한 index에 해당하는 값이 없다면
NaN을 나타내준다. reindex시 fill_value의 설정을 통해 NaN 대신 fill_value로 설정한 값을 뿌려줄 수가 있다.
DataFrame에도 동일하게 동작한다. columns란 옵션을 통해서 column에 대한 재색인도 할 수 있다.
Row, Column 삭제하기
drop 함수를 이용하여 해당 데이터의 row나 column을 삭제한다. axis에 1을 줘서 column을 삭제할 수도 있다.
row를 삭제하고 싶을 때는 index list를 입력변수로 넣는다.