직접 해보기/Python
[Pandas] 데이터프레임 요약 기본정보 요약통계량 확인하기 :: info describe columns dtypes
서윤L
2024. 6. 16. 17:07
728x90
반응형
0️⃣ DataFrame 형태, 칼럼이름, 칼럼별 데이터타입 :: shape, columns, dtypes
- 몇천 몇만 행짜리 데이터프레임을 불러오면, 이 데이터가 어떻게 생겼는지 등등 기본정보와 요약을 먼저 살펴봐야 합니다.
- 가장 먼저 살펴볼 법한 데이터프레임의 기본중의 기본정보 3가지 입니다.
- shape : 데이터프레임의 형태 = 행열의 개수
- columns : 칼럼들의 이름
- dtypes : 각 칼럼의 데이터타입
df.shape # 데이터프레임의 형태
df.columns # 칼럼들의 이름
df.dtypes # 각 칼럼의 데이터타입
1️⃣ DataFrame 칼럼별 상태 확인하기 :: info
- info 메소드를 활용하면, 각 칼럼별로 상태를 간단하게 확인할 수 있습니다.
- 칼럼별로 데이터는 몇개 들어가 있는지, 결측치가 있는지, 데이터타입은 무엇인지 확인 가능합니다.
- 테스트해보려고 아래처럼 일부러 결측치를 넣어봤는데요, Non-Null Count가 달라지는 것을 볼 수 있습니다.
df.info() # 칼럼별 상태확인
2️⃣ DataFrame 칼럼별 요약통계량 확인하기 :: describe
- describe 메소드를 사용해서 칼럼별 요약통계량들을 집계할 수 있습니다.
- 칼럼이 수치형데이터인지, 범주형데이터인지에 따라 다른 통계량을 보여줍니다.
- 수치형: 데이터 카운트, 평균값, 표준편차, 최솟값, 최댓값, 사분위값
- 범주형: 데이터 카운트, 최빈값, 최빈값의 개수
df.describe()
df.describe(include='all')
728x90
반응형