직접 해보기
-
[Pandas] 데이터프레임 중복 확인 및 제거 :: duplicated, drop_duplicates (unhashable type error 해결) (drop duplicates)직접 해보기/Python 2021. 4. 25. 21:27
파이썬 데이터프레임 중복 데이터 다루기Pandas DataFrame duplication (1) 중복되는 행(Row) 제거하기 :: drop_duplicates데이터프레임에서 중복되는 행 데이터를 제거할 때, pandas의 drop_duplicates 메소드를 사용한다. pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.html pandas.DataFrame.drop_duplicates — pandas 1.2.4 documentation pandas.pydata.org (1)-1. 1개 칼럼 기준으로 중복 제거 (열 지정)# MF 칼럼만 지정하여 중복되는 행 제거df.drop_duplicates(['MF']) (1)-..
-
[khaiii] 카카오 형태소분석기 khaiii 간단 사용법 (형태소 분석)직접 해보기/NLP 2021. 4. 24. 15:33
khaiii (Kakao Hangul Analyzer III) (카이) 사용법khaiii로 한글 텍스트 형태소 분석하기 아래 링크의 포스트를 참고하여 테스트해보았다.jeongwookie.github.io/2019/11/17/191117-khaiii-korean-tokenizer/ Khaiii 형태소 분석기 사용하기한국어로 된 데이터를 분석할 때, 이를 적절한 형태로 토크나이즈 (tokenize)하는 과정은 반드시 필요하다. 특히나 한국어는 영어와 달리 최소 의미 전달이 단어로 이루어진 언어가 아니기 때문에jeongwookie.github.io 1. 문장 테스트# 카이 형태소분석기 불러오기from khaiii import KhaiiiApiapi = KhaiiiApi()# 문장 형태소분석 테스트sent..
-
[khaiii] khaiii 품사 리스트 (khaiii POS list)직접 해보기/NLP 2021. 4. 24. 13:03
카카오 한글 형태소분석기 khaiii khaiii 품사집합 (khaiii 품사 리스트) 출처는 아래 깃헙 링크로 github.com/kakao/khaiii/wiki/%EC%BD%94%ED%8D%BC%EC%8A%A4 kakao/khaiii Kakao Hangul Analyzer III. Contribute to kakao/khaiii development by creating an account on GitHub. github.com 앞으로 품사 리스트를 볼 일이 많을 것 같아 따로 정리했다. 분류 (-언, 형태) 품사 설명 체언 NNG 일반 명사 체언 NNP 고유 명사 체언 NNB 의존 명사 체언 NP 대명사 체언 NR 수사 용언 VV 동사 용언 VA 형용사 용언 VX 보조 용언 용언 VCP 긍정 지정사..
-
[Ubuntu] 우분투에서 한글 csv 파일 불러오기 (permission denied 해결)직접 해보기/NLP 2021. 4. 23. 14:33
우분투에서 파이썬 패키지 설치하기 우분투에서 한글 csv 파일 불러오기 permission denided 오류 해결하기 우분투 파이썬 한글 깨짐 인코딩 여태까지 윈도우 환경에서만 파이썬을 굴리다가 khaiii 때문에 우분투를 처음 써보려니까 고난이 많다ㅠㅠ 1. 우분투 환경에서 권한 변경하기 (permission denided 오류 해결하기) youngjinmo.github.io/2019/07/linux-permission/ 리눅스에서 권한 변경하기 (A.k.a. Chmod) 각 권한별 명령어 디렉토리/파일 별 명령어 도커를 사용하다가 DB 때문에 리눅스를 만질일이 잠깐 있었다. TABLESPACE를 사용하기 위해서 오라클 11g가 설치된 도커 컨테이너의 Ubuntu에서 임의의 폴 youngjinmo.g..
-
[khaiii 설치] 우분투Ubuntu 설치부터 khaiii 설치 및 주피터노트북 테스트까지!직접 해보기/NLP 2021. 4. 22. 20:21
khaiii (Kakao Hangul Analyzer III) (카이)카카오에서 개발한 한글 형태소 분석기이다. 윈도우10 환경에서 카이를 사용하기 위한 이틀 간의 삽질 기록~ khaiii 빌드 및 설치방법은 아래 github 링크로github.com/kakao/khaiii/wiki/%EB%B9%8C%EB%93%9C-%EB%B0%8F-%EC%84%A4%EC%B9%98 kakao/khaiiiKakao Hangul Analyzer III. Contribute to kakao/khaiii development by creating an account on GitHub.github.com khaiii는 공식적으로 윈도우 환경을 지원하지 않는다. 그렇다면? 우분투(Ubuntu) 환경이 필요하다. 우분투는 윈..