pandas 를 이용한 csv 저장

파이썬이 가지고 있는 기본 모듈로 csv파일을 저장할 수도 있지만, pandas을 이용하고 있는 경우에는 pandas을 사용하는 편이 훨씬 편합니다. 우선 pandas를 임포트하고 예제 자료를 만들어 봅시다.

import pandas as pd
data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])

실행 결과는 다음과 같습니다.

>>> import pandas as pd
>>> data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
>>> data
{'ID': ['A1', 'A2', 'A3', 'A4', 'A5'], 'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
>>> data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
>>> data_df
   ID  X1   X2
a  A1   1  3.0
b  A2   2  4.5
c  A3   3  3.2
d  A4   4  4.0
e  A5   5  3.5

그이렇게 만든 자료를 data_df.csv이라는 파일 이름으로 저장해봅시다. 여기서 index = False을 한 이유는 자료에 'a', 'b', 'c', 'd', 'e'라는 index를 저장하지 않으려고 이렇게 False로 설정했습니다. True라고 하면 index도 저장하게 됩니다.

data_df.to_csv("data_df.csv", index = False)

그러면 실행하고 저장한 자료를 읽어서 확인해 봅시다.

>>> data_df.to_csv("data_df.csv", index = False)
>>> sample=pd.read_csv("data_df.csv")
>>> sample
   ID  X1   X2
0  A1   1  3.0
1  A2   2  4.5
2  A3   3  3.2
3  A4   4  4.0
4  A5   5  3.5

잘 저장된 것을 확인할 수 있습니다.