직접 해보기/Python
-
[Pandas] 데이터프레임 정렬하기 :: sort_values, sort values직접 해보기/Python 2024. 6. 18. 15:33
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트용 데이터프레임 생성df = pd.DataFrame({ 'col1': ['A', 'A', 'B', np.nan, 'D', 'C', 'D', 'C'], 'col2': [3, 1, 9, 8, 7, 4, 5, 6], 'col3': [0, 1, 8, 4, 2, 3, 7, 9], 'col4': ['a', 'B', 'c', 'D', 'e', 'F', 'g', 'H']})1️⃣ 칼럼 기준으로 정렬하기 (오름차순, 내림차순) :: sort_values데이터프레임의 특정칼럼 기준으로 정렬하고 싶다면 sort_values 를 사용하면 됩니다.asce..
-
[Pandas] 데이터프레임 칼럼 연산, 칼럼 위치지정 추가, 이름 변경 :: df.insert df.rename직접 해보기/Python 2024. 6. 18. 14:47
0️⃣ 데이터프레임 불러오기칼럼연산 테스트를 위한 데이터프레임을 불러오겠습니다.Kaggle에서 가져온 Flight Price Prediction 데이터셋에서 칼럼 몇가지만 가져와볼게요.flight는 비행편, airline은 비행사이름, duration은 비행시간(hour), price는 비행편 티켓가격 입니다.# 데이터셋 불러오기df = pd.read_csv( './Clean_Dataset.csv', index_col = 'flight', # 인덱스가 될 칼럼 usecols = ['flight', 'airline', 'duration', 'price'] # 가져올 칼럼들 (인덱스 포함)) 1️⃣ 기존칼럼 연산해서 새로운 칼럼 추가하기, 원하는 위치에 추가하기 :: insert..
-
[Pandas] 데이터프레임 특정 행열 선택 추출하기 :: loc iloc직접 해보기/Python 2024. 6. 18. 13:46
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트용 데이터프레임 생성df_test1 = pd.DataFrame({ 'A': [1,2,3,4,5,6,7,8,9,10], 'B': [10,20,30,40,50,60,70,80,90,100], 'C': [2,4,6,8,10,12,14,16,18,20], 'D': [1,3,5,7,9,11,13,15,17,19], 'E': [10,15,20,25,30,35,40,45,50,55]})df_test11️⃣ 특정한 열 or 특정한 행만 선택하기특정한 칼럼(열) 만 선택해서 출력하려면, 아래처럼 대괄호 2개 안에 칼럼명을 넣어주면 됩니다.원하는 ..
-
[Pandas] 데이터프레임 칼럼 값들의 개수 빈도수 카운트 :: value_counts value counts직접 해보기/Python 2024. 6. 16. 20:36
0️⃣ 칼럼에 있는 값들의 개수 :: value_counts특정 칼럼에 포함된 값들의 구성을 알고 싶을 때, value_counts 메소드를 유용하게 사용할 수 있습니다.칼럼을 지정하면, 이 칼럼에 있는 모든 고유값들의 개수(counts)를 돌려주는 메소드입니다.예시 데이터셋은 Kaggle에서 가져온 Flight Price Prediction 비행편 데이터셋인데요, 출발시간(departure_time)칼럼에 포함된 데이터가 각각 몇 개인지 뽑아봤습니다.# 지정한 칼럼에 있는 모든 고유값들의 개수(counts)df['칼럼명'].value_counts() 1️⃣ 내림차순 정렬 없애기 :: sort=False위 결과테이블을 보시면 counts 기준 내림차순으로 정렬되어 있습니다. 디폴트로 정렬되어 ..
-
[Pandas] 데이터프레임 요약 기본정보 요약통계량 확인하기 :: info describe columns dtypes직접 해보기/Python 2024. 6. 16. 17:07
0️⃣ DataFrame 형태, 칼럼이름, 칼럼별 데이터타입 :: shape, columns, dtypes몇천 몇만 행짜리 데이터프레임을 불러오면, 이 데이터가 어떻게 생겼는지 등등 기본정보와 요약을 먼저 살펴봐야 합니다.가장 먼저 살펴볼 법한 데이터프레임의 기본중의 기본정보 3가지 입니다.- shape : 데이터프레임의 형태 = 행열의 개수- columns : 칼럼들의 이름- dtypes : 각 칼럼의 데이터타입df.shape # 데이터프레임의 형태df.columns # 칼럼들의 이름df.dtypes # 각 칼럼의 데이터타입 1️⃣ DataFrame 칼럼별 상태 확인하기 :: infoinfo 메소드를 활용하면, 각 칼럼별로 상태를 간단하게 확인할 수 있습니다.칼럼별로 데이터는 ..
-
[Pandas] 시리즈Series, 데이터프레임DataFrame 생성하기직접 해보기/Python 2024. 6. 16. 01:50
0️⃣ Pandas Series 생성하기판다스는 테이블 형태의 데이터를 다루는 라이브러리입니다. 그래서 헷갈릴 때는 엑셀 테이블을 생각하면 도움이 되더라구요.판다스 시리즈Series는 칼럼(열) 1개짜리 테이블이라고 생각하면 됩니다.시리즈를 생성할 때는 들어갈 data, index를 지정해주어야 합니다. name으로 이름을 정할수도 있습니다.참고로 Series 의 대소문자는 꼭 맞게 입력해주어야 합니다!출력해보면, 아래와 같이 index, data가 입력한 순서대로 세로로 출력됩니다.import pandas as pdseries_1 = pd.Series( data = ['고양이', '강아지', '햄스터'], index = ['a', 'b', 'c'], name = '귀여운 동물 친구들'..
-
[Pandas] 데이터프레임 교차표 분석하기 :: Crosstab직접 해보기/Python 2024. 6. 15. 00:22
Pandas Crosstab 함수로 교차표 분석하고, 시각화까지 해보기!0️⃣ 라이브러리 및 데이터셋 불러오기캐글 Flight Price Prediction의 Clean_Dataset으로 테스트해보겠습니다.(캐글 데이터 다운로드: https://www.kaggle.com/datasets/shubhambathwal/flight-price-prediction)데이터 구성을 보면 항공사, 비행편, 출발도시 및 시간, 도착도시, 비행시간, 티켓가격 등으로 이루어져 있습니다.# 라이브러리 불러오기import pandas as pdimport numpy as np# 데이터셋 가져와서 확인해보기df_clean = pd.read_csv('./Clean_Dataset.csv', encoding='cp949')df_cl..
-
AICE Associate AI자격증 시험 출제범위 정리직접 해보기/Python 2024. 6. 14. 17:08
💻 AICE 개요인공지능 활용능력을 평가하는 AI능력시험KT, 한국경제신문이 주관하는 민간자격증AI 역량에 따라 5개 레벨로 구성되어 있음💻 AICE Associate 개요파이썬을 다룰 수 있는 SW준/전공자 대상- 권장대상: 현업에서 대용량 데이터를 다루거나, 데이터 기반 분석 및 기획업무를 하는 사람들- 특정 교육과정 수료, 선행 자격증 취득 등의 요건 없음응시 시간: 90분100% 실기평가- 시험환경: Jupyter Notebook (현업에서 가장 많이 활용하는 인공지능 개발환경) - 기본적인 파이썬 문법, 데이터/인공지능 모델링 분야에 대한 이해 필요오픈북 시험 방식- 구글링으로 코드 검색 및 참고 가능- 금지행위: 듀얼모니터, 온라인노트/메모, 교재, 인쇄물, 메신저/SNS, ChatGP..