-
[khaiii 설치] 우분투Ubuntu 설치부터 khaiii 설치 및 주피터노트북 테스트까지!직접 해보기/NLP 2021. 4. 22. 20:21728x90반응형
khaiii (Kakao Hangul Analyzer III) (카이)
카카오에서 개발한 한글 형태소 분석기이다.
윈도우10 환경에서 카이를 사용하기 위한 이틀 간의 삽질 기록~
khaiii 빌드 및 설치방법은 아래 github 링크로
github.com/kakao/khaiii/wiki/%EB%B9%8C%EB%93%9C-%EB%B0%8F-%EC%84%A4%EC%B9%98
khaiii는 공식적으로 윈도우 환경을 지원하지 않는다.
그렇다면? 우분투(Ubuntu) 환경이 필요하다.
우분투는 윈도우에서 사용할 수 있는 리눅스(Linux)의 일종이다.
글쓴이는 이번에 khaiii를 쓰기 위해 우분투를 처음 접했음을 밝힌다.
아래 블로그의 포스트를 참고하여 설치하였다. 압도적 감사..
corytips.tistory.com/185?category=658851
1. 우분투(Ubuntu) 설치
- <제어판> 에서 <Windows 기능 켜기>
- <Linux용 Windows 하위 시스템> 체크 (기능 켜기)
- 그 다음 PC를 재부팅해야 함
- <Microsoft Store> 에서 "Ubuntu" 검색
- 노란 박스로 표시해놓은 "Ubuntu 18.04 LTS" 설치
- 맨 왼쪽의 "Ubuntu"를 설치해서 khaiii를 설치하려고 별 짓을 다해봤지만..계속 에러가 나왔다..
- 왜냐? 저 우분투는 20.04 버전이기 때문이다.
- Ubuntu 18.04 혹은 Ubuntu 16.04 버전이어야 khaiii를 빌드할 수 있다!!ㅠㅠ
- Ubuntu를 <관리자 권한으로 실행>하면 cmd와 비슷한 창이 뜬다.
- 처음 실행하기 때문에 약간 기다려줘야 하고,
- UNIX username, password를 설정해야 한다.
- password를 아무리 쳐도 커서가 꿈쩍도 안하는데, 이게 정상이라고 한다. 아마도 보안을 위해서?
- 그냥 password를 잘 입력하고, 두 번째 입력도 똑같이 해주면 등록 완료!
- 잊어버리면 안되므로 잘 기억해놓거나, 자신없다면 소중히 메모해두자..
sudo apt-get update sudo apt-get upgrade
- 처음이니까 업그레이드 및 업데이트가 필요하다.
- 관리자 권한으로 실행하기 위해서 "sudo" 명령어를 사용했으므로, password를 입력해야 한다.
- "apt-get" 은 Advanced Packaging Tool을 의미하는데,
보통 파이썬에서 사용하는 pip과 다른 곳에서 파일을 받아온다고 한다. - Done을 보려면 몇 분 기다려야 한다.. 아주 오래 걸리지는 않는다. 내 경우 1분 정도
sudo apt-get install python3-pip pip3 --version sudo apt-get install jupyter numpy pandas
- Python 3을 써야 하니까 "pip3" 도 설치해야 한다.
- 중간에 뭘 물어보면 "Y"를 입력해준다.
- 설치가 끝나고 --version으로 버전을 확인해볼 수 있다.
- 주피터 노트북에서 파이썬을 돌릴 예정이므로 jupyter를 설치하고, (주피터 실행은 본 포스트 아래에서 계속)
- 기본적인 패키지인 numpy, pandas를 설치해준다.
2. cmake 설치
sudo pip3 install cmake
- 빌드 툴로 CMake 3.10 이상이 필요하다.
- 만약 pip3로 설치가 안된다면, apt-get 을 시도해본다.
sudo apt-get install cmake - 그래도 안된다면, cmake 버전 문제일 수 있으니 CMake 사이트에서 다운받아야 한다.
- CMake 사이트는 아래 링크
cmake.org/download/
- 설치 방법은 아래 블로그 포스트를 참고하였다. (압도적 감사....)
somjang.tistory.com/entry/Ubuntu-CMake-%EC%97%85%EB%8D%B0%EC%9D%B4%ED%8A%B8-%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95
3. khaiii 빌드 및 설치
git clone https://github.com/kakao/khaiii.git
- github에서 khaiii 설치에 필요한 파일들을 다운로드한다.
- 클론 받아오는 과정이 끝나면, 현재 위치에 "khaiii" 폴더(디렉토리)가 생성된다.
# khaiii 디렉토리로 cd khaiii # build 디렉토리 생성 mkdir build # build 디렉토리로 cd build # cmake 실행 sudo cmake ..
- khaiii 폴더 내에 "build" 폴더를 만들어준다.
- build 폴더 내에서 cmake 를 실행하여 빌드를 실행한다.
- ※ 기본적인 우분투 명령어 참고 ※
- cd = change directory = 우분투에서 디렉토리(폴더) 이동
- mkdir = make directory = 우분투에서 디렉토리(폴더) 생성
- cd ~ : 우분투에서 원래 디렉토리(home)으로 이동
- 시간이 걸리므로 done 이 나오길 바라며 기다려준다...
# 빌드 sudo make all # 리소스 빌드 # base resource sudo make resource # large resource sudo make resource_large # 설치 sudo make install
- cmake의 makefile 생성이 끝나면, 빌드 실행.
- 빌드가 잘 끝났다면 build 디렉토리 아래에 bin, lib, test 디렉토리가 생성된다.
- 빌드가 끝나면, 리소스 빌드.
- PC 저장공간에 여유가 있다면 resource_large
- base와 large의 차이점은 깃헙에서 확인할 수 있다.
- 리소스 빌드까지 끝나면, 드디어 khaiii 설치!
make install
sudo make package_python cd package_python sudo pip3 install .
- pip 명령으로 Python 바인딩을 할 수 있다.
pip3 install . (점 찍어야 함!) - 정상적으로 설치가 끝나면, Python 에서 사용할 수 있다.
- 위 이미지처럼 Successfully installed khaiii 라고 나오면.. 드디어 설치 성공이다!!
4. Jupyter Notebook 에서 khaiii 실행하기
jupyter notebook --no-browser
- 드디어 Jupyter Notebook에서 khaiii를 실행해볼 것이다.
- 우분투에서 그냥 주피터노트북을 실행하면 자꾸 에러가 나므로,
- --no-browser 명령어를 실행해서 나오는 URL를 쓰는 게 좋다!
- 위 이미지에서 노란 박스로 표시해놓은 2개의 URL 중,
- 아무거나 복사해서 브라우저 주소창에 붙여넣으면 노트북이 잘 실행된다.
from Khaiii import KhaiiiApi api = KhaiiiApi() for word in api.analyze("안녕, 세상."): print(word)
- 주피터 노트북에서 테스트해본 결과 성공적으로 진행된다! 감동의 물결...............................
- 노트북이 실행되는 위치는 다음과 같다.
- "유저이름"은 PC 유저이름일 것이고,
- "UNIX유저이름"은 위에서 우분투를 설치할 때 정했던 username이다.
C:\Users\유저이름 \AppData\Local\Packages \CanonicalGroupLimited.Ubuntu18.04onWindows_79rhkp1fndgsc \LocalState\rootfs\home \UNIX유저이름\khaiii
이제 설치를 끝냈으니 khaiii를 사용해보자!
728x90반응형'직접 해보기 > NLP' 카테고리의 다른 글
[nbextensions] Ubuntu 18.04 환경에서 Jupyter Notebook Nbextensions 설치 (0) 2021.05.13 [khaiii] 카카오 형태소분석기 khaiii 간단 사용법 (형태소 분석) (0) 2021.04.24 [khaiii] khaiii 품사 리스트 (khaiii POS list) (0) 2021.04.24 [Ubuntu] 우분투에서 한글 csv 파일 불러오기 (permission denied 해결) (0) 2021.04.23