관리 메뉴

솜씨좋은장씨

Google Colab에서 Mecab-ko-dic 쉽게 사용하기 본문

머신러닝 | 딥러닝/자연어처리

Google Colab에서 Mecab-ko-dic 쉽게 사용하기

솜씨좋은장씨 2019. 9. 12. 16:07
728x90
반응형

요즘 멀티캠퍼스에서 자연어처리에 대한 교육을 받으며 사용했던 은전한닢 프로젝트 라이브러리인 Mecab-ko-dic을

Google Colab에서 간단한 몇가지 명령어를 통하여 설치하고 사용할 수 있도록 Shell Script를 작성해 보았습니다.

 

Google Colab은 외부라이브러리의 영구적인 설치가 어려워 항상 다시 설치해주어야하여 쉽게 설치해보고자 만들어 보았습니다.

아이디어를 주신 복종순 강사님께 감사드립니다.

 

처음 만들어보는거라 Shell Script라 많이 미숙합니다. 보시고 부족한 점이나 수정해야할 점 들을 가감없이 알려주시면 감사하겠습니다.

 

Shell Script실행 시

mecab-0.996-ko-0.9.2 

mecab-ko-dic-2.1.1-20180720

가 설치됩니다.

 

2022년 1월 9일 부터 발생하던 NameError: name 'Tagger' is not defined 문제는 임시로 해결해두었습니다.

2022년 4월 29일 NameError: name 'Tagger' is not defined 확인 후

mecab-python 추가 설치하여 임시로 해결해두었습니다.

 

라이브러리에 대한 자세한 내용은 아래의 링크에서 볼 수 있습니다.

 

Bitbucket

 

bitbucket.org

Shell Script는 아래의 제 github에 올려두어 언제든 git clone명령어로 접근이 가능합니다.

 

SOMJANG/Mecab-ko-for-Google-Colab

Use Mecab Library(NLP Library) in Google Colab. Contribute to SOMJANG/Mecab-ko-for-Google-Colab development by creating an account on GitHub.

github.com

자세한 사용 방법은 아래와 같습니다.

 

1. git clone으로 저장소 가져오기

위의 링크로 들어가 Clone or download 버튼을 눌러 주소를 복사합니다.

 

 

 ! git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git 

명령어를 통해 저장소를 복제해 옵니다.

 

 

가져온 저장소는

 

 

Mecab-ko-for-Google-Colab 디렉터리로 가져와져 있는 것을 볼 수 있습니다.

 cd Mecab-ko-for-Google-Colab

해당 디렉토리로 이동하여

 !bash install_mecab-ko_on_colab_light_220111.sh

shell Script파일을 실행하여 줍니다.

 

 

 

3~4분정도의 시간이 지나면 설치가 완료됩니다. (네트워크 상태에 따라 조금씩 다를 수 있습니다.)

 

 

from konlpy.tag import Mecab
mecab = Mecab()
text = u"""이제 구글 코랩에서 Mecab-ko라이브러리 사용이 가능합니다. 읽어주셔서 감사합니다."""
nouns = mecab.nouns(text)
print(nouns)

설치 후 위와 같이 import해서 사용하면됩니다!

 

읽어주셔서 감사합니다.

 

활용사례

금융문자 분석 경진대회 Baseline Code

 

데이콘 금융문자 분석 기본 제공 초급자 코드를 보다보니 어디서 많이 봤던 코드가 있어보니 익숙한 주소가 보였습니다.

 

 

Wikidocs Pytorch로 시작하는 딥러닝 입문

 

 

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net

부족하지만 다들 잘 활용해주셔서 감사합니다!

Comments