일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Kaggle
- AI 경진대회
- 편스토랑
- 파이썬
- github
- leetcode
- Baekjoon
- SW Expert Academy
- dacon
- hackerrank
- Real or Not? NLP with Disaster Tweets
- 편스토랑 우승상품
- ChatGPT
- 자연어처리
- programmers
- 데이콘
- 맥북
- Git
- 우분투
- PYTHON
- 백준
- 코로나19
- 프로그래머스 파이썬
- 금융문자분석경진대회
- Docker
- 더현대서울 맛집
- 프로그래머스
- 캐치카페
- gs25
- ubuntu
- Today
- Total
목록
반응형
Mecab-ko-dic (3)
솜씨좋은장씨
from konlpy.tag import Mecab mecab = Mecab() print(mecab.pos("솜씨좋은장씨의 개발블로그")) 최근 Google Colab에서 mecab에 사용자 사전을 추가하는 방법에 대해서 문의 하시는 분이 많기도 하셨고 저도 mecab에서 사용자 사전을 추가하여 사용해야하는 경우가 생겨 작성해보았습니다. 2023.04.22 - [머신러닝 | 딥러닝/자연어처리] - Google Colab에서 mecab-ko-dic 사용자 사전 추가하기! (2023년 업데이트 버전)
요즘 멀티캠퍼스에서 자연어처리에 대한 교육을 받으며 사용했던 은전한닢 프로젝트 라이브러리인 Mecab-ko-dic을 Google Colab에서 간단한 몇가지 명령어를 통하여 설치하고 사용할 수 있도록 Shell Script를 작성해 보았습니다. Google Colab은 외부라이브러리의 영구적인 설치가 어려워 항상 다시 설치해주어야하여 쉽게 설치해보고자 만들어 보았습니다. 아이디어를 주신 복종순 강사님께 감사드립니다. 처음 만들어보는거라 Shell Script라 많이 미숙합니다. 보시고 부족한 점이나 수정해야할 점 들을 가감없이 알려주시면 감사하겠습니다. Shell Script실행 시 mecab-0.996-ko-0.9.2 mecab-ko-dic-2.1.1-20180720 가 설치됩니다. 2022년 1월 9..
mecab-ko-dic은 오픈 소스 형태소 분석 엔진인 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다. 말뭉치 학습과 사전 목록은 모두 21세기 세종계획의 성과물을 사용하였다고 합니다. 자세한 내용은 아래의 페이지에서 볼 수 있습니다. Bitbucket bitbucket.org 다음은 설치 과정입니다. 설치 환경은 Windows 10의 VirtualBox 가상머신에 설치되어있는 Ubuntu 18.04 LTS입니다. 설치 전 자바가 설치되어있는지 확인해보고 설치가 되어있지 않다면 JAVA를 먼저 설치하기 바랍니다. [Ubuntu]OpenJDK설치하기 먼저 apt-get을 Update해줍니다. $ sudo apt-get update 그 다음 OpenJDK를 설치합니다. $ sudo a..