일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 맥북
- 파이썬
- 자연어처리
- AI 경진대회
- 더현대서울 맛집
- hackerrank
- dacon
- 캐치카페
- SW Expert Academy
- Baekjoon
- 프로그래머스
- PYTHON
- 편스토랑 우승상품
- Kaggle
- 우분투
- 금융문자분석경진대회
- 데이콘
- Docker
- leetcode
- 프로그래머스 파이썬
- 백준
- Real or Not? NLP with Disaster Tweets
- 편스토랑
- 코로나19
- gs25
- programmers
- Git
- github
- ubuntu
- ChatGPT
- Today
- Total
솜씨좋은장씨
Google Colab에서 Mecab-ko-dic 쉽게 사용하기 본문
요즘 멀티캠퍼스에서 자연어처리에 대한 교육을 받으며 사용했던 은전한닢 프로젝트 라이브러리인 Mecab-ko-dic을
Google Colab에서 간단한 몇가지 명령어를 통하여 설치하고 사용할 수 있도록 Shell Script를 작성해 보았습니다.
Google Colab은 외부라이브러리의 영구적인 설치가 어려워 항상 다시 설치해주어야하여 쉽게 설치해보고자 만들어 보았습니다.
아이디어를 주신 복종순 강사님께 감사드립니다.
처음 만들어보는거라 Shell Script라 많이 미숙합니다. 보시고 부족한 점이나 수정해야할 점 들을 가감없이 알려주시면 감사하겠습니다.
Shell Script실행 시
mecab-0.996-ko-0.9.2
mecab-ko-dic-2.1.1-20180720
가 설치됩니다.
2022년 1월 9일 부터 발생하던 NameError: name 'Tagger' is not defined 문제는 임시로 해결해두었습니다.
2022년 4월 29일 NameError: name 'Tagger' is not defined 확인 후
mecab-python 추가 설치하여 임시로 해결해두었습니다.
라이브러리에 대한 자세한 내용은 아래의 링크에서 볼 수 있습니다.
Shell Script는 아래의 제 github에 올려두어 언제든 git clone명령어로 접근이 가능합니다.
자세한 사용 방법은 아래와 같습니다.
1. git clone으로 저장소 가져오기
위의 링크로 들어가 Clone or download 버튼을 눌러 주소를 복사합니다.
! git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git
명령어를 통해 저장소를 복제해 옵니다.
가져온 저장소는
Mecab-ko-for-Google-Colab 디렉터리로 가져와져 있는 것을 볼 수 있습니다.
cd Mecab-ko-for-Google-Colab
해당 디렉토리로 이동하여
!bash install_mecab-ko_on_colab_light_220111.sh
shell Script파일을 실행하여 줍니다.
3~4분정도의 시간이 지나면 설치가 완료됩니다. (네트워크 상태에 따라 조금씩 다를 수 있습니다.)
from konlpy.tag import Mecab
mecab = Mecab()
text = u"""이제 구글 코랩에서 Mecab-ko라이브러리 사용이 가능합니다. 읽어주셔서 감사합니다."""
nouns = mecab.nouns(text)
print(nouns)
설치 후 위와 같이 import해서 사용하면됩니다!
읽어주셔서 감사합니다.
활용사례
금융문자 분석 경진대회 Baseline Code
데이콘 금융문자 분석 기본 제공 초급자 코드를 보다보니 어디서 많이 봤던 코드가 있어보니 익숙한 주소가 보였습니다.
Wikidocs Pytorch로 시작하는 딥러닝 입문
부족하지만 다들 잘 활용해주셔서 감사합니다!
'머신러닝 | 딥러닝 > 자연어처리' 카테고리의 다른 글
Google Colab에서 mecab-ko-dic 사용자 사전 추가하기! (29) | 2020.11.04 |
---|---|
Ubuntu에서 Khaiii 설치하기 (0) | 2020.09.10 |
Windows 에서 Mecab ( mecab 기반 한국어 형태소 분석기 ) 설치하는 방법 (16) | 2020.09.07 |
Ubuntu 18.04 LTS에 mecab-ko-dic 설치하기 (7) | 2019.09.12 |
Ubuntu에서 Mecab-ko 사용을 위한 개발환경 설정 정리 (2) | 2019.09.08 |