Python/데이터분석 - pandas 3

pandas_데이터 정렬 (sort)

1. index 기준으로 정렬 1-1. 오름차순으로 정렬 #오름차순으로 정렬 -> default df.sort_index() 1-2. 내림차순으로 정렬 #내림차순으로 정렬 df.sort_index(ascending=False) 2. column별로 정렬 2-1. 오름차순으로 정렬 #오름차순으로 정렬 df.sort_values(by='column명') - value기준으로 sorting하면 결측치가 있는 행의 경우 맨 끝으로 정렬됨 2-2. 내림차순으로 정렬 #내림차순으로 정렬 df.sort_values(by='column명', ascending=False) +) 함수의 추가적인 옵션은 구글링해서 활용하기 2-3. 복수정렬 #오름차순 df.sort_values(by=['column명1', 'column명2..

pandas_파일 불러오기 / 데이터 기본정보 확인 / column명 변경

import pandas import pandas as pd pd.read_csv() : csv 파일 읽어오기 df = pd.read_csv('파일명or파일경로') df df.head(n) : 맨 앞에서부터 n개의 행 출력 → default값 5개 df.head() df.tail(n) : 맨 끝에서부터 n개의 행 출력 → default값 5개 df.tail(7) column 다루기 - column(열) 출력 # pandas에서 dtype이 object인 경우 -> 문자열 (columns의 data type) df.columns - column명 재정의 : 기존의 이름을 불러와서 그 중 일부만 바꾸고 싶은 경우 #1) df.columns를 통해 기존의 column명 확인 #2) 새로운 column명 지정 ..

pandas_Series / DataFrame

1. package 로드 import pandas as pd 2. pandas의 Series와 DataFrame - 일차원 data는 Series, 이차원 data는 DataFrame - 여러개의 data column이 있으면 DataFrame, 하나만 있으면 Series (=dataframe에서 column하나만 떼어서 보면 Series data) 2.1. Series 만들기 : 일차원의 data type a = [1, 2, 3, 4] pd.Series(a) type(a) #pandas에서 사용하기 위해 pandas에서 사용 가능한 datatype(Series)로 바꿔줌 2.2. DataFrame 만들기 : 이차원의 data type - DataFrame의 왼쪽 첫번째 열은 index - DataFra..