pandas 를 이용한 csv 저장
파이썬이 가지고 있는 기본 모듈로 csv
파일을 저장할 수도 있지만, pandas
을 이용하고 있는 경우에는 pandas
을 사용하는 편이 훨씬 편합니다. 우선 pandas
를 임포트하고 예제 자료를 만들어 봅시다.
import pandas as pd
data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
실행 결과는 다음과 같습니다.
>>> import pandas as pd
>>> data = {'ID': ['A1', 'A2', 'A3', 'A4', 'A5'],'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
>>> data
{'ID': ['A1', 'A2', 'A3', 'A4', 'A5'], 'X1': [1, 2, 3, 4, 5], 'X2': [3.0, 4.5, 3.2, 4.0, 3.5]}
>>> data_df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])
>>> data_df
ID X1 X2
a A1 1 3.0
b A2 2 4.5
c A3 3 3.2
d A4 4 4.0
e A5 5 3.5
그이렇게 만든 자료를 data_df.csv
이라는 파일 이름으로 저장해봅시다. 여기서 index = False
을 한 이유는 자료에 'a', 'b', 'c', 'd', 'e'
라는 index
를 저장하지 않으려고 이렇게 False
로 설정했습니다. True
라고 하면 index
도 저장하게 됩니다.
data_df.to_csv("data_df.csv", index = False)
그러면 실행하고 저장한 자료를 읽어서 확인해 봅시다.
>>> data_df.to_csv("data_df.csv", index = False)
>>> sample=pd.read_csv("data_df.csv")
>>> sample
ID X1 X2
0 A1 1 3.0
1 A2 2 4.5
2 A3 3 3.2
3 A4 4 4.0
4 A5 5 3.5
잘 저장된 것을 확인할 수 있습니다.