전체 글
-
[Pandas] 데이터프레임 합치기 조인 병합 :: pd.merge (join)직접 해보기/Python 2024. 6. 20. 16:37
0️⃣ 데이터프레임 생성예시가 될 데이터프레임 2개를 먼저 만들어 볼게요.import pandas as pdimport numpy as np# 병합할 데이터프레임 2개 생성df_customer = pd.DataFrame({ 'customer_id' : [1, 2, 3, 4, 5], 'name' : ['Kim', 'Lee', 'Park', 'Choi', 'Yoon'], 'grade' : ['Silver', 'Gold', 'Gold', 'Silver', 'Platinum']})df_orders = pd.DataFrame({ 'customer_id' : [1, 2, 2, 2, 3, 3, 5, 5, 5, 10], 'item_order' : ['pumpkin', 'potato', 'g..
-
[Pandas] 데이터프레임 합치기 병합하기 :: pd.concat직접 해보기/Python 2024. 6. 20. 15:36
0️⃣ 데이터프레임 생성예시가 될 데이터프레임 2개를 먼저 만들어 볼게요.import pandas as pdimport numpy as np# 병합할 데이터프레임 2개 생성df_1 = pd.DataFrame({ 'product' : ['onion', 'carrot', 'cabbage', 'pumpkin', 'potato'], 'amount' : [100, 50, 70, 30, 80] })df_2 = pd.DataFrame({ 'product' : ['pumpkin', 'potato', 'garlic', 'corn', 'pepper'], 'amount' : [20, 60, 90, 80, 50]}, index = [3,4,5,6,7])1️⃣ 칼럼 이름이 동일한 데이터프레임끼리 합치는..
-
[Pandas] 데이터프레임에서 피벗테이블 만들기 :: pivot_table pivot table직접 해보기/Python 2024. 6. 19. 00:13
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트 데이터프레임 생성df = pd.DataFrame({ 'container_id' : ['con_1', 'con_1', 'con_1', 'con_2', 'con_2', 'con_2', 'con_3', 'con_3', 'con_3'], 'product' : ['monitor', 'pc', 'cable', 'monitor', 'pc', 'cable', 'monitor', 'pc', 'cable'], 'made' : ['korea', 'korea', 'korea', 'korea', 'korea', 'korea', 'china', 'china', 'c..
-
[Pandas] 데이터프레임 그룹화 그룹핑 그룹집계하기 :: groupby, aggregate직접 해보기/Python 2024. 6. 18. 20:46
0️⃣ 특정 칼럼을 기준으로 데이터프레임 그룹화하기 :: groupby예시 데이터셋은 Kaggle에서 가져온 Flight Price Prediction 비행편 데이터셋인데요, 첫번째 칼럼은 쓸모없으니 삭제하고출발시간(departure_time) 칼럼을 기준으로 데이터를 그룹화 시켜보았습니다.다만 그룹핑시킨 결과를 출력해도 깔끔한 데이터셋이 나오는 건 아닙니다.이 결과 중에 무엇을 출력할지 선택해줘야 하는데요, 하나씩 테스트 해보겠습니다.import pandas as pdimport numpy as np# 데이터셋 불러오기df = pd.read_csv('./Clean_Dataset.csv', encoding='cp949')df = df.drop('Unnamed: 0', axis=1)# departur..
-
[Pandas] 데이터프레임 정렬하기 :: sort_values, sort values직접 해보기/Python 2024. 6. 18. 15:33
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트용 데이터프레임 생성df = pd.DataFrame({ 'col1': ['A', 'A', 'B', np.nan, 'D', 'C', 'D', 'C'], 'col2': [3, 1, 9, 8, 7, 4, 5, 6], 'col3': [0, 1, 8, 4, 2, 3, 7, 9], 'col4': ['a', 'B', 'c', 'D', 'e', 'F', 'g', 'H']})1️⃣ 칼럼 기준으로 정렬하기 (오름차순, 내림차순) :: sort_values데이터프레임의 특정칼럼 기준으로 정렬하고 싶다면 sort_values 를 사용하면 됩니다.asce..
-
[Pandas] 데이터프레임 칼럼 연산, 칼럼 위치지정 추가, 이름 변경 :: df.insert df.rename직접 해보기/Python 2024. 6. 18. 14:47
0️⃣ 데이터프레임 불러오기칼럼연산 테스트를 위한 데이터프레임을 불러오겠습니다.Kaggle에서 가져온 Flight Price Prediction 데이터셋에서 칼럼 몇가지만 가져와볼게요.flight는 비행편, airline은 비행사이름, duration은 비행시간(hour), price는 비행편 티켓가격 입니다.# 데이터셋 불러오기df = pd.read_csv( './Clean_Dataset.csv', index_col = 'flight', # 인덱스가 될 칼럼 usecols = ['flight', 'airline', 'duration', 'price'] # 가져올 칼럼들 (인덱스 포함)) 1️⃣ 기존칼럼 연산해서 새로운 칼럼 추가하기, 원하는 위치에 추가하기 :: insert..
-
[Pandas] 데이터프레임 특정 행열 선택 추출하기 :: loc iloc직접 해보기/Python 2024. 6. 18. 13:46
0️⃣ 데이터프레임 생성먼저 테스트를 위한 데이터프레임을 생성하겠습니다.import pandas as pdimport numpy as np# 테스트용 데이터프레임 생성df_test1 = pd.DataFrame({ 'A': [1,2,3,4,5,6,7,8,9,10], 'B': [10,20,30,40,50,60,70,80,90,100], 'C': [2,4,6,8,10,12,14,16,18,20], 'D': [1,3,5,7,9,11,13,15,17,19], 'E': [10,15,20,25,30,35,40,45,50,55]})df_test11️⃣ 특정한 열 or 특정한 행만 선택하기특정한 칼럼(열) 만 선택해서 출력하려면, 아래처럼 대괄호 2개 안에 칼럼명을 넣어주면 됩니다.원하는 ..
-
국내 AI 반도체 ETF 한번에 비교하기 (SOL AI반도체소부장, KODEX AI반도체핵심장비 등)위키/경제&투자 2024. 6. 17. 01:51
국내 AI 반도체 ETF 한번에 비교 (24.06.14 장마감 기준)💰 순자산총액 비교국내 반도체 AI 테마 ETF는 SOL, KODEX, TIGER, ACE에 하나씩 있습니다. 국내 대표 ETF 운용사별로 하나씩은 있는 셈이네요.모두 상장된지 1년 남짓 혹은 1년도 안된 상품들입니다.이 중 SOL AI반도체소부장의 순자산총액이 약 4천억으로, 운용규모가 가장 큰 ETF입니다.💰 총보수율(TER), 실제부담비용율 비교총보수율(TER)은 일반적인 보수에 기타비용을 더한 비용인데요, 여기에 수수료까지 더해야 투자자가 실제로 부담하는 비용이 산출됩니다. TIGER AI반도체핵심공정이 약 0.54%로 가장 높고, 그 다음 SOL AI반도체소부장이 약 0.53% 로 큰 차이가 없네요.ACE AI반도체포커스는..