NLP/KoNLPy

[NLP] Khaii

데이터 세상 2021. 3. 18. 10:41

카이(Khaiii)

  • Kakao Hangul Analyzer III
  • 국립국어원이 구축한 세종 corpus를 이용해 CNN 모델을 적용해 학습
  • C++로 구현해 GPU 없이도 형태소 분석이 가능하며 실행 속도 빠름

http://tech.kakao.com/2018/12/13/khaii 

 

kakao의 오픈소스 Ep9 - Khaiii : 카카오의 딥러닝 기반 형태소 분석기

“카카오의 오픈소스를 소개합니다” 아홉 번째는 jamie.lim과 자연어 처리 파트 동료들이 함께 개발한 khaiii(Kakao Hangul Analyzer III)입니다. khaiii는 세종 코퍼스를 이용하여 CNN(Convolutional Neural Network,

tech.kakao.com

  • 입력 문장을 문자 단위로 읽어 들인 뒤 convolution filter가 이 문자들을 슬라이딩해가면서 정보를 추출

 

Khaii 설치

Khaii는 Linux, MacOS만 지원. Windows OS는 미 지원

1. khaii clone

git clone https://github.com/kakao/khaiii.git

2. cmake 설치

pip install cmake

3. Build

cd khaii
mkdir build
cd build
cmake ..

※ C++ Compiler 설치 필요

Windows OS 기준 MinGW(gcc) 설치

 

 

 


References

반응형

'NLP > KoNLPy' 카테고리의 다른 글

[NLP] Mecab 설치(Windows OS)  (0) 2021.04.21
[NLP] soynlp  (0) 2021.04.11
[NLP] Mecab  (0) 2021.04.11
[NLP] Okt  (0) 2021.03.18
[NLP] KoNLPy  (0) 2021.03.11