Python/Python 기타

pandas 를 이용한 excel 로드

arvigoes 2020. 12. 1. 22:40

우선 pandas 를 설치 해 줍니다.

pip install pandas 든 pycharm 에서 설정에서 추가 해 주셔도 됩니다.

 

import pandas

excel_data = pandas.read_excel('data.xls')

잘 읽었는지 확인을 위해 실행해 봅니다.

 

전 이런 에러가 나오네요

xlrd 를 설치 해야 하나 봅니다.

pandas 처럼 xlrd 를 추가로 설치 해 봅니다.

xlrd Description 을 보면 

'Library for developers to extract data from Microsoft Excel(TM) spreadsheet files. 이라고 되어있네요

pandas 도 저 라이브러리를 통해 데이터를 가져 오나 봅니다.

 

저라이브러리만 설치해도 되지만 pandas 가 표를 다루는 작업에 특화된 라이브러리이기에 한번더 가공된 상태로 

사용하는게 사용면에서는 좀 더 편하니 저는 pandas 를 사용 하도록 하겠습니다.

 

print(code_data.head())

를 통해 데이터를 읽은 데이터를 출력해 보도록 합니다.

잘 로드 되었네요

 

pandas 는 엑셀의 첫줄을 자동으로 컬럼명으로 인식 합니다.

예를 들면

idx 이름 전화 주소 성별 직업
1 AAA 123-123 ABC동 M 코린이
2 BBB 456-456 DEF동 F 어린이
3 CCC 789-789 GHI동 M 백수

엑셀이 되어 있을때 첫 줄 idx, 이름, 전화, 주소.... 를 각각의 대표 컬럼 명으로 인식을 자동으로 해 줍니다.

import pandas

excel_data = pandas.read_excel('data.xls')

print(excel_data['이름']) # 이름만 출력
print(excel_data['주소'][0]) # AAA 의 주소만 출력

이런식으로 엑셀을 참조하여 사용하면 됩니다.

엑셀을 편집하여 저장하는 것은 다음에 추가로 해 보도록 하겠습니다.

'Python > Python 기타' 카테고리의 다른 글

파이썬 윈도우 종료  (0) 2020.12.15
pyinstaller 설치 & pycharm 연결  (0) 2020.11.30
python console 모듈 설치  (0) 2020.11.30
python csv file 쓰기  (0) 2020.03.05
공공 데이터 권한 취득 방법  (0) 2019.12.25