직접 해보기
-
[Pandas] 시리즈Series, 데이터프레임DataFrame 생성하기직접 해보기/Python 2024. 6. 16. 01:50
0️⃣ Pandas Series 생성하기판다스는 테이블 형태의 데이터를 다루는 라이브러리입니다. 그래서 헷갈릴 때는 엑셀 테이블을 생각하면 도움이 되더라구요.판다스 시리즈Series는 칼럼(열) 1개짜리 테이블이라고 생각하면 됩니다.시리즈를 생성할 때는 들어갈 data, index를 지정해주어야 합니다. name으로 이름을 정할수도 있습니다.참고로 Series 의 대소문자는 꼭 맞게 입력해주어야 합니다!출력해보면, 아래와 같이 index, data가 입력한 순서대로 세로로 출력됩니다.import pandas as pdseries_1 = pd.Series( data = ['고양이', '강아지', '햄스터'], index = ['a', 'b', 'c'], name = '귀여운 동물 친구들'..
-
[Pandas] 데이터프레임 교차표 분석하기 :: Crosstab직접 해보기/Python 2024. 6. 15. 00:22
Pandas Crosstab 함수로 교차표 분석하고, 시각화까지 해보기!0️⃣ 라이브러리 및 데이터셋 불러오기캐글 Flight Price Prediction의 Clean_Dataset으로 테스트해보겠습니다.(캐글 데이터 다운로드: https://www.kaggle.com/datasets/shubhambathwal/flight-price-prediction)데이터 구성을 보면 항공사, 비행편, 출발도시 및 시간, 도착도시, 비행시간, 티켓가격 등으로 이루어져 있습니다.# 라이브러리 불러오기import pandas as pdimport numpy as np# 데이터셋 가져와서 확인해보기df_clean = pd.read_csv('./Clean_Dataset.csv', encoding='cp949')df_cl..
-
AICE Associate AI자격증 시험 출제범위 정리직접 해보기/Python 2024. 6. 14. 17:08
💻 AICE 개요인공지능 활용능력을 평가하는 AI능력시험KT, 한국경제신문이 주관하는 민간자격증AI 역량에 따라 5개 레벨로 구성되어 있음💻 AICE Associate 개요파이썬을 다룰 수 있는 SW준/전공자 대상- 권장대상: 현업에서 대용량 데이터를 다루거나, 데이터 기반 분석 및 기획업무를 하는 사람들- 특정 교육과정 수료, 선행 자격증 취득 등의 요건 없음응시 시간: 90분100% 실기평가- 시험환경: Jupyter Notebook (현업에서 가장 많이 활용하는 인공지능 개발환경) - 기본적인 파이썬 문법, 데이터/인공지능 모델링 분야에 대한 이해 필요오픈북 시험 방식- 구글링으로 코드 검색 및 참고 가능- 금지행위: 듀얼모니터, 온라인노트/메모, 교재, 인쇄물, 메신저/SNS, ChatGP..
-
간단하게 파이썬 버전 확인하고 업그레이드 or 다운그레이드하기 (Python version upgrade downgrade)직접 해보기/Python 2024. 6. 14. 16:10
아나콘다 프롬프트Anaconda Prompt에서 파이썬 버전 확인하고 바꾸기 1️⃣ 파이썬 버전 확인하기아나콘다 프롬프트 실행입력: python --version 현재 설치된 파이썬 버전이 나옵니다.python --version 2️⃣ 업/다운그레이드 시킬 수 있는 파이썬 버전 확인하기입력: conda search python현재 재설치할 수 있는 파이썬 버전이 쭉 나옵니다.conda search python 3️⃣ 파이썬 버전 업그레이드 or 다운그레이드 재설치 진행하기입력: conda install python==버전시간이 꽤 걸릴 수 있습니다. 기다리고 있으면 파이썬 버전에 맞게 알아서 필수 패키지들까지 버전을 업/다운그레이드 시켜줍니다.done 이 나오면 완료입니다!conda install ..
-
[셀레니움 크롤링 예제] 다나와 리뷰 크롤링을 위한 지속가능한 코드 만들기 (2)직접 해보기/Python 2024. 6. 10. 22:45
다나와 크롤링 예제 — 공기청정기 인기 제품리뷰 수집하기✅ 이전 단계가 궁금하다면, (이전포스팅) 다나와 제품정보 크롤링하기! 0️⃣ 이전 포스팅에서 크롤링했던 제품정보들을 가지고 와서 살펴보겠습니다.피클파일로 저장했던 데이터프레임을 그대로 가져와서, dtypes로 데이터타입까지 잘 가져와졌는지 점검합니다.수치데이터가 들어간 칼럼들은 float 혹은 int로 잘 저장되어 왔네요.1️⃣ 제품별 상세페이지로 들어간 다음, 리뷰 페이지를 넘기면서 크롤링해오려고 합니다.제품별로 상세페이지 URL을 수집했었죠! 이제 이 URL에 순서대로 접속해서 리뷰를 크롤링해오겠습니다.상세페이지 URL 접속 → 상품리뷰로 이동 → 리뷰 페이지 넘기면서 → 페이지 소스 가져오기 흐름으로 구성해볼게요.일단 맨 첫번째 제품..
-
[Python파이썬] 피클Pickle 파일 저장하기 불러오기직접 해보기/Python 2024. 6. 7. 17:56
피클파일 저장하고 불러오는 방법 간단하게 정리 ✅ pickle은 객체 자체를 "원래형태 그대로" 저장하고 불러올 수 있게 해주는 라이브러리입니다.리스트는 리스트 그대로 저장할 수 있고, 데이터프레임은 데이터프레임 그대로 저장할 수 있다는 의미입니다!뿐만 아니라 변수, 함수, 클래스까지 피클파일로 저장하고 불러올 수 있습니다.저장하고 불러올 때마다 변환할 필요가 없으니, 빠르고 간편해서 유용합니다.이렇게 형태 그대로 저장하고 불러올 수 있는 것은 객체를 바이너리 형태 즉, 이진수로 이루어진 파일로 만들기 때문이라네요.때문에 피클파일 자체를 열어도 인간이 이해할 수는 없습니다.. 파이썬에서 피클파일을 객체로 불러와야 알아볼 수 있어요. 1️⃣ pickle파일 저장하기pickle.dump(저장할 객체, ope..
-
[셀레니움 크롤링 예제] 다나와 리뷰 크롤링을 위한 지속가능한 코드 만들기 (1)직접 해보기/Python 2024. 6. 7. 03:10
다나와 크롤링 예제 — 공기청정기 인기3사 제품정보 수집하기✅ 셀레니움, 크롬드라이버 설치 전이거나 기본 사용법을 익히기 전이라면, 설치 완료하기! 기본 사용법 익혀보기! 0️⃣ 다나와에서 [공기청정기] 카테고리만 선택해서 크롤링해볼게요.다나와는 친절하게도 카테고리별 URL을 따로 챙겨주시네요.이걸 복사해와서 driver.get(url) 안에 넣겠습니다. 아래 코드를 실행하면 다나와 공기청정기 카테고리로 이동합니다.# 필요한 패키지 가져오기from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.keys import Keysfrom selenium.we..
-
셀레니움Selenium 주요 기능 모음, 주로 쓰는 메소드 모음직접 해보기/Python 2024. 6. 4. 23:23
셀레니움 주요 클래스별 메소드 ✔️ webdriver: 브라우저 제어 클래스.브라우저 인스턴스를 생성하고 제어함. webdriver.Chrome(), webdriver.Firefox(), webdriver.Safari(), webdriver.Edge(): 브라우저 설정.get(url): 특정 URL로 이동.close(): 현재 브라우저 창 닫기.quit(): 모든 브라우저 창 닫고 WebDriver 종료.find_element(by, value): 단일 요소 찾기.find_elements(by, value): 여러 요소 찾기.save_screenshot(filename): 페이지 스크린샷 저장.✔️ WebElement: 웹 페이지 요소와 상호작용할 때 사용하는 클래스.click(): 요소 클릭.send_..