일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Baekjoon
- 데이콘
- 우분투
- programmers
- ChatGPT
- 파이썬
- 프로그래머스 파이썬
- Kaggle
- github
- dacon
- Git
- 코로나19
- 편스토랑 우승상품
- hackerrank
- 맥북
- 편스토랑
- AI 경진대회
- 캐치카페
- 백준
- gs25
- 더현대서울 맛집
- ubuntu
- Real or Not? NLP with Disaster Tweets
- Docker
- 자연어처리
- SW Expert Academy
- leetcode
- 금융문자분석경진대회
- 프로그래머스
- PYTHON
- Today
- Total
목록
반응형
머신러닝 | 딥러닝/자연어처리 (7)
솜씨좋은장씨
2020.11.04 - [머신러닝 | 딥러닝/자연어처리] - Google Colab에서 mecab-ko-dic 사용자 사전 추가하기! Google Colab에서 mecab-ko-dic 사용자 사전 추가하기! from konlpy.tag import Mecab mecab = Mecab() print(mecab.pos("솜씨좋은장씨의 개발블로그")) 최근 Google Colab에서 mecab에 사용자 사전을 추가하는 방법에 대해서 문의 하시는 분이 많기도 하셨고 저도 mecab에서 somjang.tistory.com 이전에 작성하였던 Colab 에서 mecab-ko-dic 사용자 사전 추가 방법이 이런 저런 오류들이 많이 발생하여 여러 종류의 질문이 많이 들어왔었습니다. 간만에 자세하게 이것저것 테스트해볼 ..
from konlpy.tag import Mecab mecab = Mecab() print(mecab.pos("솜씨좋은장씨의 개발블로그")) 최근 Google Colab에서 mecab에 사용자 사전을 추가하는 방법에 대해서 문의 하시는 분이 많기도 하셨고 저도 mecab에서 사용자 사전을 추가하여 사용해야하는 경우가 생겨 작성해보았습니다. 2023.04.22 - [머신러닝 | 딥러닝/자연어처리] - Google Colab에서 mecab-ko-dic 사용자 사전 추가하기! (2023년 업데이트 버전)
형태소 분석기로는 mecab을 주로 사용하다가 kakao에서 만든 khaiii를 활용하여 분석한 결과를 적용하면 현재 하고 있는 작업에서 어떤 변화가 있을까 궁금하여 설치해보게 되었습니다. khaiii는 kakao에서 만든 형태소 분석기로 세종 코퍼스와 그외 오류를 수정한 다양한 코퍼스 그리고 CNN을 기반으로 만들어진 형태소 분석기라고 합니다. kakao/khaiii Kakao Hangul Analyzer III. Contribute to kakao/khaiii development by creating an account on GitHub. github.com 파일 다운로드 $ git clone https://github.com/kakao/khaiii.git 먼저 git clone 명령어를 통해 설치..
은전한닢 프로젝트 - Winows 설치 방법 koshort/pyeunjeon 은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이스 - koshort/pyeunjeon github.com Windows에서 mecab을 활용하여 작업을 할 일이 생겨 설치를 해야하여 찾아보던 중 pyeunjeon 이라는 패키지를 발견하여 설치를 진행해보니 잘 동작하는 것을 확인하였습니다. 그동안 윈도우에서는 설치가 어렵다! 라고만 들었는데 생각보다 쉽게 설치가 가능하여 조금 놀랐습니다. 설치방법은 다음과 같습니다. 설치 방법 > pip install eunjeon 여기서 설치 간 error: Microsoft Visual C++ 14.0 is required. 오류가 나는 경우에는 [Py..
요즘 멀티캠퍼스에서 자연어처리에 대한 교육을 받으며 사용했던 은전한닢 프로젝트 라이브러리인 Mecab-ko-dic을 Google Colab에서 간단한 몇가지 명령어를 통하여 설치하고 사용할 수 있도록 Shell Script를 작성해 보았습니다. Google Colab은 외부라이브러리의 영구적인 설치가 어려워 항상 다시 설치해주어야하여 쉽게 설치해보고자 만들어 보았습니다. 아이디어를 주신 복종순 강사님께 감사드립니다. 처음 만들어보는거라 Shell Script라 많이 미숙합니다. 보시고 부족한 점이나 수정해야할 점 들을 가감없이 알려주시면 감사하겠습니다. Shell Script실행 시 mecab-0.996-ko-0.9.2 mecab-ko-dic-2.1.1-20180720 가 설치됩니다. 2022년 1월 9..
mecab-ko-dic은 오픈 소스 형태소 분석 엔진인 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다. 말뭉치 학습과 사전 목록은 모두 21세기 세종계획의 성과물을 사용하였다고 합니다. 자세한 내용은 아래의 페이지에서 볼 수 있습니다. Bitbucket bitbucket.org 다음은 설치 과정입니다. 설치 환경은 Windows 10의 VirtualBox 가상머신에 설치되어있는 Ubuntu 18.04 LTS입니다. 설치 전 자바가 설치되어있는지 확인해보고 설치가 되어있지 않다면 JAVA를 먼저 설치하기 바랍니다. [Ubuntu]OpenJDK설치하기 먼저 apt-get을 Update해줍니다. $ sudo apt-get update 그 다음 OpenJDK를 설치합니다. $ sudo a..
이 글은 Multicampus에서 강의를 해주신 복종순강사님의 수업시간에서 설치했던 과정을 정리한 내용입니다. 더 많은 내용은 아래에서 참고해주시기 바랍니다. swacademy - Overview javaexpert@nate.com. swacademy has 32 repositories available. Follow their code on GitHub. github.com 1. Virtual Box 설치하기 [Windows]Oracle VM VirtualBox설치하기(ver 5.2.32) 1. VirtualBox 설치 파일 다운로드 받기 설치하기 위해서는 설치파일과 Extension Pack 두가지를 다운로드 받아야합니다. 먼저 아래의 링크로 들어갑니다. https://www.virtualbox.or..