Python/데이터분석 - pandas

pandas_파일 불러오기 / 데이터 기본정보 확인 / column명 변경

양쟁 2023. 3. 3. 02:08

import pandas

import pandas as pd

 

pd.read_csv()

: csv 파일 읽어오기

df = pd.read_csv('파일명or파일경로')
df

 

df.head(n)

: 맨 앞에서부터 n개의 행 출력

→ default값 5개

df.head()

 

df.tail(n)

: 맨 끝에서부터 n개의 행 출력

→ default값 5개

df.tail(7)

 

column 다루기

- column(열) 출력

# pandas에서 dtype이 object인 경우 -> 문자열 (columns의 data type)

df.columns

 

- column명 재정의

: 기존의 이름을 불러와서 그 중 일부만 바꾸고 싶은 경우

#1) df.columns를 통해 기존의 column명 확인
#2) 새로운 column명 지정

column명 재정의

 

 

Index다루기

- Index 출력

df.index

 

df.info()

: row(행)의 기본적인 정보와 데이터 타입을 알려줌

* info method는 주로 null값과 데이터 타입을 볼 때 활용 (info는 데이터의 특성을 보여줌)

- 컬럼이 몇개인지

- 컬럼별로 결측치가 몇개씩 있는지

- 컬럼의 datatype이 무엇인지

- dataframe이 차지하는 메모리가 얼마나 되는지

df.info()

 

 

df.describe()

: 통계 정보를 출력해줌

df.describe()

 

 

df.shape

- 형태를 출력해줌

- tuple 형태로 반환되며, 첫번째 논항은 row, 두번째 논항은 column의 개수를 의미

df.shape