직접 해보기/Python
-
[matplotlib] plt.pyplot 한글 깨짐 한글폰트 표시하기직접 해보기/Python 2024. 6. 22. 16:34
matplotlib (plt) 그래프에서 한글 깨질 때 대처방법✅ plt.rcParams[] 으로 전역 폰트 설정하기rcParams로 전역 폰트을 한번만 설정해주면, 그래프를 작성할 때마다 설정해줄 필요가 없습니다.rcParams는 차트의 다양한 꾸밈요소들을 모아놓은 딕셔너리라고 보면 되는데요, 글꼴뿐만 아니라 선이나 바탕색도 지정 가능해요.※ Document 참조 (https://matplotlib.org/stable/api/matplotlib_configuration_api.html#matplotlib.rcParams) 아래와 같이 plt.rcParams['font.family'] 를 불러서 value값을 바꿔주면해당 주피터노트북 파일 내에서 한글폰트 지정은 완료되므로, 다른 그래프를 그릴때 다시 ..
-
[Pandas] 데이터프레임 그룹별 상관계수 살펴보기 :: corr (correlation)직접 해보기/Python 2024. 6. 20. 22:07
1️⃣ 수치형 데이터간 상관계수 :: corr()예시 데이터셋은 Kaggle에서 가져온 Flight Price Prediction 비행편 데이터셋입니다. (캐글 데이터 다운로드: https://www.kaggle.com/datasets/shubhambathwal/flight-price-prediction)데이터프레임에 포함된 수치형 데이터간의 상관관계는 corr 메소드로 간단하게 살펴볼 수 있습니다.수치형만 적용 가능하므로 numeric_only = True 파라미터를 넣어줘야 합니다.# 변수들간 상관계수 살펴보기df.corr(numeric_only=True)이 데이터셋에 포함된 수치형 칼럼 3개 서로간의 상관계수들이 도출되었네요.duration(비행시간) - price(비행편 가격) 간 상관계수..
-
[Pandas] 데이터프레임 합치기 조인 병합 :: pd.merge (join)직접 해보기/Python 2024. 6. 20. 16:37
0️⃣ 데이터프레임 생성예시가 될 데이터프레임 2개를 먼저 만들어 볼게요.import pandas as pdimport numpy as np# 병합할 데이터프레임 2개 생성df_customer = pd.DataFrame({ 'customer_id' : [1, 2, 3, 4, 5], 'name' : ['Kim', 'Lee', 'Park', 'Choi', 'Yoon'], 'grade' : ['Silver', 'Gold', 'Gold', 'Silver', 'Platinum']})df_orders = pd.DataFrame({ 'customer_id' : [1, 2, 2, 2, 3, 3, 5, 5, 5, 10], 'item_order' : ['pumpkin', 'potato', 'g..
-
[Pandas] 데이터프레임 합치기 병합하기 :: pd.concat직접 해보기/Python 2024. 6. 20. 15:36
0️⃣ 데이터프레임 생성예시가 될 데이터프레임 2개를 먼저 만들어 볼게요.import pandas as pdimport numpy as np# 병합할 데이터프레임 2개 생성df_1 = pd.DataFrame({ 'product' : ['onion', 'carrot', 'cabbage', 'pumpkin', 'potato'], 'amount' : [100, 50, 70, 30, 80] })df_2 = pd.DataFrame({ 'product' : ['pumpkin', 'potato', 'garlic', 'corn', 'pepper'], 'amount' : [20, 60, 90, 80, 50]}, index = [3,4,5,6,7])1️⃣ 칼럼 이름이 동일한 데이터프레임끼리 합치는..
-
[Pandas] 데이터프레임에서 피벗테이블 만들기 :: pivot_table pivot table직접 해보기/Python 2024. 6. 19. 00:13
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트 데이터프레임 생성df = pd.DataFrame({ 'container_id' : ['con_1', 'con_1', 'con_1', 'con_2', 'con_2', 'con_2', 'con_3', 'con_3', 'con_3'], 'product' : ['monitor', 'pc', 'cable', 'monitor', 'pc', 'cable', 'monitor', 'pc', 'cable'], 'made' : ['korea', 'korea', 'korea', 'korea', 'korea', 'korea', 'china', 'china', 'c..
-
[Pandas] 데이터프레임 그룹화 그룹핑 그룹집계하기 :: groupby, aggregate직접 해보기/Python 2024. 6. 18. 20:46
0️⃣ 특정 칼럼을 기준으로 데이터프레임 그룹화하기 :: groupby예시 데이터셋은 Kaggle에서 가져온 Flight Price Prediction 비행편 데이터셋인데요, 첫번째 칼럼은 쓸모없으니 삭제하고출발시간(departure_time) 칼럼을 기준으로 데이터를 그룹화 시켜보았습니다.다만 그룹핑시킨 결과를 출력해도 깔끔한 데이터셋이 나오는 건 아닙니다.이 결과 중에 무엇을 출력할지 선택해줘야 하는데요, 하나씩 테스트 해보겠습니다.import pandas as pdimport numpy as np# 데이터셋 불러오기df = pd.read_csv('./Clean_Dataset.csv', encoding='cp949')df = df.drop('Unnamed: 0', axis=1)# departur..
-
[Pandas] 데이터프레임 정렬하기 :: sort_values, sort values직접 해보기/Python 2024. 6. 18. 15:33
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트용 데이터프레임 생성df = pd.DataFrame({ 'col1': ['A', 'A', 'B', np.nan, 'D', 'C', 'D', 'C'], 'col2': [3, 1, 9, 8, 7, 4, 5, 6], 'col3': [0, 1, 8, 4, 2, 3, 7, 9], 'col4': ['a', 'B', 'c', 'D', 'e', 'F', 'g', 'H']})1️⃣ 칼럼 기준으로 정렬하기 (오름차순, 내림차순) :: sort_values데이터프레임의 특정칼럼 기준으로 정렬하고 싶다면 sort_values 를 사용하면 됩니다.asce..
-
[Pandas] 데이터프레임 칼럼 연산, 칼럼 위치지정 추가, 이름 변경 :: df.insert df.rename직접 해보기/Python 2024. 6. 18. 14:47
0️⃣ 데이터프레임 불러오기칼럼연산 테스트를 위한 데이터프레임을 불러오겠습니다.Kaggle에서 가져온 Flight Price Prediction 데이터셋에서 칼럼 몇가지만 가져와볼게요.flight는 비행편, airline은 비행사이름, duration은 비행시간(hour), price는 비행편 티켓가격 입니다.# 데이터셋 불러오기df = pd.read_csv( './Clean_Dataset.csv', index_col = 'flight', # 인덱스가 될 칼럼 usecols = ['flight', 'airline', 'duration', 'price'] # 가져올 칼럼들 (인덱스 포함)) 1️⃣ 기존칼럼 연산해서 새로운 칼럼 추가하기, 원하는 위치에 추가하기 :: insert..