Python/데이터분석 - pandas
pandas_파일 불러오기 / 데이터 기본정보 확인 / column명 변경
양쟁
2023. 3. 3. 02:08
import pandas
import pandas as pd
pd.read_csv()
: csv 파일 읽어오기
df = pd.read_csv('파일명or파일경로')
df
df.head(n)
: 맨 앞에서부터 n개의 행 출력
→ default값 5개
df.head()
df.tail(n)
: 맨 끝에서부터 n개의 행 출력
→ default값 5개
df.tail(7)
column 다루기
- column(열) 출력
# pandas에서 dtype이 object인 경우 -> 문자열 (columns의 data type)
df.columns
- column명 재정의
: 기존의 이름을 불러와서 그 중 일부만 바꾸고 싶은 경우
#1) df.columns를 통해 기존의 column명 확인
#2) 새로운 column명 지정
Index다루기
- Index 출력
df.index
df.info()
: row(행)의 기본적인 정보와 데이터 타입을 알려줌
* info method는 주로 null값과 데이터 타입을 볼 때 활용 (info는 데이터의 특성을 보여줌)
- 컬럼이 몇개인지
- 컬럼별로 결측치가 몇개씩 있는지
- 컬럼의 datatype이 무엇인지
- dataframe이 차지하는 메모리가 얼마나 되는지
df.info()
df.describe()
: 통계 정보를 출력해줌
df.describe()
df.shape
- 형태를 출력해줌
- tuple 형태로 반환되며, 첫번째 논항은 row, 두번째 논항은 column의 개수를 의미
df.shape