1. 판다스(Pandas)
* '웨스 맥키니'가 개발한 라이브러리
* 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터프레임)를 제공하는 모듈
1-1. Series와 DataFrame
* 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표데이터는 시리즈
* 표의 데이터 부분을 values라고 부름
* 표의 행이름을 index라고 부름
* 표의 열이름을 columns라고 부름
* 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values, index, columnss로 이루어져 있음
* 데이터프레임과 시리즈의 value는 넘파이의 ndarray 기반
2. CSV 파일 다루기
* CSV(Comma Separated Value)의 약자로 데이터를 쉼표로 구분한 파일
* 엑셀로 로딩할 수 있지만 쉼표로 구부노된 CSV가 더 가볍기 때문에 데이터로 많이 사용
* 공공데이터 포털에서도 CSV 포맷의 파일을 제공
# pd.read_csv(CSV파일. 인코딩)
pd.read_csv('/content/korean-idol.csv')
pd.read_csv('http://bit.ly/ds-korean-idol')
3.엑셀파일 읽어오기
pd.read_excel('/content/korean-idol.xlsx')
4. 데이터프레임 기본정보 알아보기
'코딩공부 > 파이썬(Python)' 카테고리의 다른 글
Python_Numpy (2) | 2023.06.09 |
---|---|
Python_파이썬과 MySQL연동 (0) | 2023.03.23 |
Python_DAO,DTO,VO,디자인패턴(MVC패턴) (0) | 2023.03.23 |
Python_파일 입출력 라이브러리 (1) | 2023.03.23 |
Python_클로저와 데코레이터 (0) | 2023.03.23 |