안녕하세요 ?
너무 큰 엑셀파일은 다룰때마다 걱정이 됩니다.
한가지 행동을 할때마다 기다리기 일수이고, row 제한을 넘어가서 난처하기도 하죠.
파이썬 라이브러리인 pandas는 익숙해지기만 한다면 엑셀보다 훨씬 편리하게 데이터를 다룰 수 있을 것 같습니다.
기억을 위해, 이번에 다뤘던 기능들을 간단하게 정리해 놓습니다.
0. 파이썬에서 판다스 라이브러리 불러오기
import pandas as pd
1. 파이썬에서 판다스를 이용하여 엑셀파일 불러오기
data = pd.read_excel('data.xlsx')
2. 파이썬에서 판다스를 이용하여 CSV파일 불러오기
data = pd.read_csv('data.csv')
3. 파이썬에서 판다스로 불러온 데이터 확인하는 방법
data.head(10)
data.shape
4. 파이썬에서 판다스로 데이터 연결하기
data00 = data01.append(data02, ignore_index=True)
혹은
data00 = pd.concat([data01,data02], axis=0)
#data01 아래에 data02를 연결함
data00 = pd.concat([data01,data02], axis=1)
#data01 옆으로 data02를 연결함
5. 파이썬 판다스, 엑셀의 피벗 테이블 기능
traffic3 = pd.pivot_table(traffic2, index=['지점번호', '월', '일', '방향'],
columns='시', values='교통량')
6. 파이썬 판다스, 역피벗 테이블 기능
traffic2 = pd.melt(traffic,
id_vars=['지점번호', '월', '일', '방향'],
value_vars=list(traffic.columns[4:]), # list of days of the week
var_name='시',
value_name='교통량')
7. 파이썬 판다스, merge 기능 (엑셀의 vlookup)
traffic3 = pd.merge(traffic2, location, # merge할 DataFrame 객체 이름
how='left', # left, rigth, inner (default), outer
left_on='지점번호',
right_on='지점번호')
7. 파이썬 판다스, CSV로 저장하기
data00.to_csv("./data00.csv",
sep=str(','), header=True, index=True, encoding='CP949')
댓글
댓글 쓰기