직접 해보기/Python

[Pandas] 데이터프레임 요약 기본정보 요약통계량 확인하기 :: info describe columns dtypes

서윤L 2024. 6. 16. 17:07
728x90
반응형

0️⃣  DataFrame 형태, 칼럼이름, 칼럼별 데이터타입  ::  shape, columns, dtypes

  • 몇천 몇만 행짜리 데이터프레임을 불러오면, 이 데이터가 어떻게 생겼는지 등등 기본정보와 요약을 먼저 살펴봐야 합니다.
  • 가장 먼저 살펴볼 법한 데이터프레임의 기본중의 기본정보 3가지 입니다.
    - shape : 데이터프레임의 형태 = 행열의 개수
    - columns : 칼럼들의 이름
    - dtypes : 각 칼럼의 데이터타입
df.shape    # 데이터프레임의 형태
df.columns  # 칼럼들의 이름
df.dtypes   # 각 칼럼의 데이터타입

 

 

 


1️⃣  DataFrame 칼럼별 상태 확인하기  ::  info

  • info 메소드를 활용하면, 각 칼럼별로 상태를 간단하게 확인할 수 있습니다.
  • 칼럼별로 데이터는 몇개 들어가 있는지, 결측치가 있는지, 데이터타입은 무엇인지 확인 가능합니다.
    - 테스트해보려고 아래처럼 일부러 결측치를 넣어봤는데요, Non-Null Count가 달라지는 것을 볼 수 있습니다.
df.info()  # 칼럼별 상태확인


2️⃣  DataFrame 칼럼별 요약통계량 확인하기  ::  describe

  • describe 메소드를 사용해서 칼럼별 요약통계량들을 집계할 수 있습니다.
  • 칼럼이 수치형데이터인지, 범주형데이터인지에 따라 다른 통계량을 보여줍니다.
    - 수치형: 데이터 카운트, 평균값, 표준편차, 최솟값, 최댓값, 사분위값
    - 범주형: 데이터 카운트, 최빈값, 최빈값의 개수
df.describe()
df.describe(include='all')


 

 

 

728x90
반응형