일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- ChatGPT
- Kaggle
- 맥북
- 자연어처리
- 더현대서울 맛집
- 데이콘
- 프로그래머스
- AI 경진대회
- 편스토랑 우승상품
- 백준
- Git
- 편스토랑
- dacon
- 캐치카페
- leetcode
- 코로나19
- gs25
- ubuntu
- Real or Not? NLP with Disaster Tweets
- programmers
- SW Expert Academy
- Baekjoon
- 파이썬
- github
- PYTHON
- Docker
- 우분투
- hackerrank
- 금융문자분석경진대회
- 프로그래머스 파이썬
- Today
- Total
목록
반응형
분류 전체보기 (1651)
솜씨좋은장씨
기존 로고 Somjang이라는 단어는 '솜씨좋은장씨'라는 단어의 줄임말 '솜장'을 영어로 표현한 단어입니다. 기존의 로고에서는 밑줄과 왼쪽의 노란색 삼각형을 통해서 포인트를 주었었습니다. 변경한 로고 바뀐 로고는 기존의 밑줄을 제거하고 Somjang이라는 단어 뒤에 머신러닝 / 딥러닝의 느낌을 주고 싶어 뇌를 폴리곤 아트로 표현하여 보았습니다. 마지막으로 j위에 O을 다홍색으로 주어 포인트를 주었습니다. 다음에는 또 어떤 로고로 바꿀지 한 번 고민해보아야겠습니다~
이번주는 수요일 삼성 SOSCON, 목요일 T-아카데미 61차 세미나, 일요일은 DEVGEST 2019 여기저기 많이 보러 다녔던 주 였습니다. 월~토는 멀티캠퍼스에서 교육을 듣고있어 일주일에 하루밖에없는 휴일인 일요일이지만 같이 교육을 듣고있는 형과 복종순강사님의 추천을 받아 알게된 DEVFEST 2019를 신청하여 듣고 왔습니다. DevFest는 매년 GDG에서 개최하는 개발과 연관된 직군 모두가 참여하여 즐기는 축제이며 올해도 9월부터 12월까지 전세계 191개국에서 428번의 DevFest가 열릴 예정이라고 합니다. 올해 한국에서도 최소 14번의 DevFest가 열리게되고 그 중 오늘은 Seoul에서 열리는 첫 DevFest라고 합니다. 추천을 받고 갈까말까 고민하다가 일단 제 모교인 세종대학교에..
요즘 들어서 대만카스테라, 벌집아이스크림 때처럼 흑당 버블티 가게가 우후 죽순 생겨나고 있습니다. 인스타그램 태그를 활용하면 흑당버블티에 대한 동향을 알 수 있을까라는 의문점이 들었고 셀레니움을 활용한 인스타그램 크롤링을 통해 흑당버블티에 대한 분석을 해보았습니다. 먼저 #흑당버블티 태그가 달려있는 게시물의 개수가 몇 개 인지 확인해보니 무려 76,291개나 되었습니다. 처음 목표는 이 76,291개 전체를 다 크롤링해와서 주마다 게시물 개수의 추이도 보고 # 흑당버블티 태그가 달려있는 글 들 속에서 각 회사별로 몇 번씩 언급이 되었는지 확인해보는 것이 목표였습니다. 그러나!!!!! 정말 앗, 이런! 하는 오류였습니다. 목표인 76,291개를 도달하기 전에 크롬드라이버가 다운이 되어버렸습니다. 제 추측으..
프로젝트를 진행하면서 네이버 기사 내용을 긍정/부정으로 분류해주는 기능을 넣자고 하여 구현해보았습니다. 모델을 만드는 것은 위키독스에서 제공하는 딥러닝을 이용한 자연어처리 입문에 나와있는 코드를 활용하였습니다. 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net 0. 코드 관련 2020년 12월 22일 일부 코드 업데이트가 진행되었습니다. 아래의 코드의 대부분은 python과 keras를 공부한지 두달도 안된 상황에서 진행한 코드로 중간중간 설명이 이상하거나 제대로 동작하지 않는 부분이 있을 수도 있습니다. 양해부탁드립니다. 기사 제목 분류 관련 전체적인 코드 업데이트는 2021년에 진행할 예정입니다. 감사합니다. 솜장 드림. 1. 학습데이터, 테스트데이터 만들기 먼저 모델을 만들고..
1. 주제를 선택한 계기 특정 프랜차이즈에 관련된 최근 키워드를 알려주려면 어떤 것을 참고하면 좋을까 생각하다가 인스타그램에 걸려있는 특정 주제에 대한 여러 태그들을 크롤링하여 그 태그들을 빈도수로 정렬하여 보여주면 어떨까 생각해보았고 보여줄때 그냥 글자, 빈도수 이렇게 보여주면 재미 없으니 워드클라우드로 그려서 보여주면 어떨까 생각하여 일단 한번 해서 확인해보자라는 생각으로 해보게 되었습니다. 2. 태그 크롤링 하기 군 생활을 하면서 부대 근처에 있어 자주 갔던 커피베이 태그를 검색해서 그 글 속에 있는 태그들을 크롤링 해보기로 했습니다. 크롬 개발자 도구를 활용하여 태그를 검색하고 나오는 그 페이지의 코드를 확인해보니 클릭하지 않는 이상 각각의 게시글에 있는 태그를 가져올 수 없었습니다. Seleni..
작업 환경은 아래와 같습니다. - OS : Mac OS Catalina - jupyter notebook, python3 음성파일은 아래의 홈페이지에서 녹음 후 컴퓨터에 저장하였습니다. Online Voice Recorder online-voice-recorder.com ETRI에서 제공하는 open API 중 음성인식 API를 사용하려고 녹음한 음성 mp3파일을 api에 요청변수로 보내니 {"result":0,"return_object":{"recognized":"ASR_NOTOKEN"}} 위와 같이 "ASR_NOTOKEN"이라는 결과를 확인할 수 있었습니다. ETRI 홈페이지를 가보니 해당하는 오류는 파일이 샘플링 주파수(16kHz)가 맞지 않았을때라는 결과를 볼 수 있었습니다. 위를 해결하기 위해서..
드디어! 9월 25일 아이패드 OS 가 업데이트 되었습니다. 업데이트가 되기 전에는 아이패드에 블루투스 키보드를 연결을 하고 사용을 해도 마우스가 지원되지 않아 탈옥을 해서 마우스를 사용하거나 마우스 대신 애플펜슬, 손가락을 통해 터치를 했어야 했기에 불편한 점이 많았습니다. 아이패드 OS로 업데이트가 된 이후 드디어 블루투스 마우스를 지원하여 사용할 수 있게 되었습니다. 마우스 사용 설정방법 먼저 설정 > 손쉬운 사용 > 터치 메뉴로 들어갑니다 AssistiveTouch 메뉴로 들어갑니다. AssistiveTouch 메뉴로 들어왔으면 AssistiveTouch라고 써있는 곳의 버튼을 눌러 활성화 해줍니다. 마우스 키 메뉴로 들어가서 마우스 키 항목을 활성화 시켜줍니다. 그 다음 블루투스에서 마우스를 연..
1. 이 주제를 선정하게 된 계기 개인프로젝트로 어떤 것을 해볼까 고민하면서 처음에는 영화를 추천해주는 챗봇을 만들어 보려고 했다가 더 공부를하고 만들기로 하고 하루라는 짧은 시간안에 구현해볼 수 있는 다른 주제가 무엇이 있나 찾던 중, 제가 평소에 자주 이용하는 왓챠라는 페이지에서 제가 봤던 영화들 목록과 평점과 같은 데이터를 가지고 새로운 영화가 나왔을 때 내가 시청하고 나서 어떤 점수를 부여할 것인지 예측해주는 시스템이 떠올랐습니다. 제가 왓챠에 제공하는 데이터는 제가 봤던 영화의 목록과 그 영화에 부여하는 평점 정보 뿐인데 어떻게 아직 개봉하지 않은 영화들의 평점을 예측해서 보여주는가 고민을 해보았습니다. 고민하다가 떠올랐던 것이 제가 봤다고 한 영화의 줄거리와 그 영화에 부여된 평점, 그리고 장..
과거의 영화 줄거리, 평점, 장르 데이터를 가지고 새로운 영화의 평점을 예측하는 모델을 만들 때 학습데이터로 사용하기 위한 데이터들을 크롤링해오기 위한 코드를 짜 보았습니다. 데이터를 수집하기 위한 크롤러를 제작하는데에는 Selenium, BeautifulSoup 그리고 requests를 사용했습니다. 네이버 영화에서 데이터를 수집해오기는 해야하나 순차적으로 데이터를 가져올 수 있도록 링크를 어디서 가져올까 고민하던 중 네이버 시리즈에 18812개의 영화 링크가 있는 페이지를 찾았습니다. 저는 이 페이지에서 판매순으로 가져오기로 했습니다. from bs4 import BeautifulSoup import requests from selenium import webdriver as wd from selen..
9월 25일! 드디어 기다리고 기다렸던 아이패드의 최신 OS인 iPad OS 정식 버전이 나왔습니다. 사실 저는 iPad OS를 베타 버전이 나온 첫날부터 계속 사용하고 있었지만 mac Catalina OS를 Beta 8, 9로 업데이트한 이후로 아이패드와 Sidecar로 연결하여 사용하려고 하면 iPad에 최신 OS가 있어야한다는 알림과 함께 연결이 되지 않아 사용을 하지 못하고 있었기에 빨리 iPad OS의 정식버전이 나오기를 기다렸습니다. 정식 버전 이후에는 정상적으로 연결이 가능해져 현재는 다시 아주 잘 사용하는 기능이 되었습니다.ㅎㅎ 그럼 Sidecar를 사용하는데 필요한 환경과 사용방법, 그리고 사용하면서 느낀 장점과 단점에 대해서 적어 보겠습니다. 만약! 내가 mac OS Monterey를 ..
Jupyter notebook을 사용하면서 새로운 python3 노트북을 만들기 위해서는 New 버튼을 클릭해야합니다. 그런데 가끔 크롬으로 Jupyter notebook을 열고 New버튼을 클릭하였는데도 반응이 없고 터미널에 나오는 오류 내용도 없을때 방법을 알려드립니다. 이 방법은 터미널과 다른 다른 브라우저에서는 이상이 없고 오직 크롬에서만 이러한 현상이 있을때 조치가 가능한 방법입니다. 아래에서 설명하는 방법을 따라 테스트해보기 바랍니다. 먼저 다른 브라우저에서도 반응이 없는지 확인합니다. >> Mac이라면 사파리, Windows라면 internet explorer에서 동작하는지 확인합니다. >> 확인을 위해 아래의 명령어를 활용합니다. $ jupyter notebook --no-browser >..
제가 아이패드 프로를 사고나서 가장 잘 샀다고 느낄때는 맥북에 아이패드를 연결하여 서브 모니터로 활용할 때입니다. 그럼 아이패드를 어떻게 서브 모니터로 활용하냐 바로 Duet Display라는 어플리케이션을 활용하는 것입니다. Duet Display는 Apple의 전 엔지니어들이 개발하였다고하며 연결 시 끊기는 느낌없이 사용이 가능하다고 합니다. Duet Display를 사용하려면 먼저 아이패드와 아이패드를 서브모니터로 사용할 맥북에 Duet Display를 설치해야합니다. 1. 아이패드에 설치하기 아이패드에서 앱스토어에 들어가 Duet Display를 검색하고 설치합니다. 저는 다운로드를 받아서 열기로 되어있지만 사실 Duet Display는 12,000원의 유료 어플리케이션입니다. 하지만 사용하면서 ..
1. 해당 API를 알게 된 계기 요즘 인공지능을 활용한 자연어처리라는 주제로 교육을 받고 있는 멀티캠퍼스에서 현재까지 배운 웹 크롤링, 자연어처리 방법 등을 활용하여 개인프로젝트를 각자 한 가지씩 정한 후 실시하여 결과를 발표하기로 했습니다. 여러가지 아이디어를 생각하면서 무얼 해볼까 고민하다가 한 가지 고민했던 것이 평소에 흥미를 가지고 있고 많이 보는 영화라는 주제로 무언가를 만들어보거나 탐구해보면 어떨까했습니다. 그러기 위해서는 영화에 대한 데이터가 필요했습니다. 저는 교육에서 배운 웹크롤링을해서 줄거리, 배우, 평점, 리뷰와 같은 필요한 데이터를 가져와야겠다 생각했습니다. 그런데 생각을 해보니 하루에도 수많은 영화가 만들어지는데 각 포털사이트에서 새로운 영화의 정보를 하나하나를 사람이 직접 수작..
현재 저는 맥북프로에서 macOS Catalina 베타8 버전을 사용하고 있습니다. mongodb를 설치하고 나서 $ mongod 를 실행하니 무결성을 확인할 수 없기 때문에 mongod를 열 수 없습니다! 라는 알림과 함께 휴지통으로 이동시키겠냐는......... 버튼이 나왔습니다. 열심히 찾아보니 새로운 OS에서는 게이트 키퍼라는 기능으로 문제가 발생하기도 한다고 합니다. 이럴때 해결하는 방법은 다음과 같습니다. $ sudo spctl --master-disable 위의 명령어를 사용하여 게이트 키퍼를 잠시 꺼줍니다. 그 후 data 디렉터리가 있는 디렉터리로 이동합니다. $ cd PythonHome $ mongod --dbpath=data/db mongod 명령어 뒤에 --dbpath=data/db..
1. 설치파일 다운로드 받기 Download Center: Community Server Download MongoDB Community Server, the most popular non-relational database built to address the needs of modern applications. www.mongodb.com 먼저 위의 링크로 접속합니다. Server를 선택하고 Version : 4.2.0 (Current release) OS : macOS x64 Package : TGZ 선택하고 Download를 클릭합니다. 다운로드가 제대로 되었는지 확인합니다. 2. 설치하기 다운로드가 잘 되었는지 확인하였으면 터미널을 열어줍니다. 터미널을 열고 먼저 다운로드한 파일이 저장되어있는 ..
2년의 데이터를 가지고 도출한 최적의 귀경시간 본 표에 적혀있는 시간은 그저 받아온 데이터를 그래프로 그리고 눈으로 확인해보며 선정한 시간입니다. 만약에 보시게 된다면 재미로 참고만 하시기 바랍니다~ 출발지 추석 1일 후 소요시간 추석 2일 후 소요시간 대전 07:00 ~ 09:00 약 1시간 30분 ~ 2시간 07:00 ~ 09:00 약 1시간 30분 대구 06:00, 09:00 약 3시간 06:00, 09:00 약 3시간 부산 04:00, 06:00 약 5시간 04:00, 06:00 약 5시간 광주 07:00 ~ 08:00 약 3시간 40분 09:00 경 약 3시간 40분 강릉 08:00 경 약 2시간 30분 08:00 경 약 2시간 30분 앞서 받아와 만들었던 DataFrame을 그래프로 그려 최적..
[Python]과거의 데이터로 최적의 추석 귀경시간 추측해보기(feat, matplotlib) 2년의 데이터를 가지고 도출한 최적의 귀경시간 본 표에 적혀있는 시간은 그저 받아온 데이터를 그래프로 그리고 눈으로 확인해보며 선정한 시간입니다. 만약에 보시게 된다면 재미로 참고만 하시기 바랍니다~ 출.. somjang.tistory.com 아래의 과정을 바탕으로 위의 결과를 만들어 보았습니다. 오늘은 목, 금, 토 2019년 추석연휴의 마지막 날! 자소서 쓰는건 재미없고, 뭔가 재밌는걸 해볼까 고민하다가 귀경길이 시작되었다는 기사를 보고 관련 데이터를 모아보고 그 데이터를 pandas의 Dataframe으로도 만들어보기도하고 그래프도 그려보면 어떨까 싶어 검색을 하기 시작했습니다. 검색을 하던 중 고속도로 ..
Keka는 다음과 같은 형식의 파일을 지원합니다. 생성가능 압축파일 형식 : 7Z, ZIP, TAR, GZIP, BZIP2, XZ, LZIP, DMG 압축해제 가능 파일 형식: 7Z ZIP RAR TAR GZIP BZIP2 XZ LZIP DMG ISO LZMA EXE CAB WIM PAX JAR APK APPX CPGZ CPIO 프로그램을 알게된 계기 한국도로공사 고속도로 공공데이터 포털에서 구간 교통량에대한 데이터를 zip형식의 파일로 다운받아 압축을 해제하려는데 맥에서 제공되는 기본 압축해제 기능으로는 압축해제가 불가하다는 알림이 나왔습니다. 이에 윈도우에서 정말 잘쓰고 있는 반디집을 설치하고자 앱스토어에 검색해보니 어....? 22,000원이라는 금액에 (우리 취직하고 돈벌면 그때 다시만나자 라고 ..
제가 즐겨보는 Youtube B Man채널에서 제 최애 영화인 어벤져스 엔드게임의 영화 명장면을 정리한 어벤져스 엔드게임 명장면 총정리라는 영상의 댓글 가져오기를 해보았습니다. 인스타그램 크롤링 코드가 필요하신 분은 아래의 링크를 참고해주세요! [Python] Selenium을 활용하여 인스타그램 크롤링 하기! 이번 글에서는 Python과 Selenium을 활용하여 인스타그램 게시물을 크롤링하는 방법에 대해서 적어보려 합니다. 해당 코드를 활용하여 발생하는 문제는 코드 사용자에게 있음을 알려드립니다. 1. 필 somjang.tistory.com 1. requests와 BeautifulSoup를 활용하여 시도하기 처음에는 requests와 BeautifulSoup를 사용하여 댓글 가져오기를 시도했습니다. ..
1. 구글 크롬 최신으로 업데이트하기 먼저 크롬의 맨 우측 상단의 세 개의 점을 클릭하여 크롬의 설정페이지로 들어갑니다. 왼쪽 메뉴에서 Chrome 정보를 클릭하여 업데이트를 실시합니다. 다시시작을 클릭하여 업데이트를 완료합니다. 크롬의 버전을 기억합니다. 현재 이 글에서 크롬버전은 77.0.3865.75 입니다. 2. Selenium Chrome drirver 다운로드 아래의 링크로 이동하여 설치파일을 다운로드 받습니다. 2020년 확인결과 파일 다운로드 방법이 변경되어 다시 업데이트 하였습니다. SeleniumHQ Browser Automation If you want to create robust, browser-based regression automation suites and tests, sc..
공공데이터포털에서 제공하는 API를 처음 활용하고자 할 때 분명히 정상적인 과정으로 활용 승인 받고 얻은 API KEY임에도 불구하고 SERVICE KEY IS NOT REGISTERED ERROR가 발생하여 이 에러로 3일 넘게 혼자 끙끙 거리던 적이 있었다. 그렇게 몇 날 며칠 동안 방법을 찾은 결과 방법을 찾았다. 1. API KEY 인코딩 문제 공공데이터포털에서 제공하는 API KEY는 이미 인코딩이 되어있는 채로 제공이 됩니다. 따라서 API에 이 인코딩 되어있는 키로 데이터를 요청하게 되면 가차없이 SERVICE KEY IS NOT REGISTERED ERROR 에러를 선물해줍니다. 다음과 같은 방법으로 요청 전 API KEY를 디코딩 후 사용하여 이 문제를 해결할 수 있습니다. Python ..
1. 활용하게 된 계기 태풍이 오기 직전이었던 2019년 8월 11일 토요일 냉면투어를 위해 백령도로 향했던 필자는 태풍으로 인하여 예상치 못한 일에 봉착한 적이 있었습니다. 바로 태풍의 북상으로 인한 먼 바다 풍랑주의보로 인하여 선박 운항을 하지 않는다는!!!!!! 청천벽력과 같은 내용의 문자가 날아왔던 것입니다. 아니 이럴수가, 1박 2일로 짧게 계획 했던 여행은 그렇게 3박 4일의 긴 여행으로 변하였습니다. 여러 선박회사와 연안여객터미널로 연락하여 배가 출항하는지 여부를 확인하던 차에 머리에 스치고 갔던 것이 오픈 API였습니다. 미세먼지 정보를 알려주는 미세먼지 API처럼 선박 운항 관련 정보를 제공하는 API도 있지 않을까? 바로 공공데이터포털에 접속하여 검색하여보니 국제 및 연안 여객 터미널 ..
1. 공공데이터 포털 홈페이지 접속 공공데이터포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다. www.data.go.kr 위의 링크를 클릭하여 홈페이지에 접속합니다. 2. 회원가입하기 상단의 회원가입 버튼을 클릭하여 회원가입을 실시합니다. 회원가입을 완료하였으면 로그인을 실시합니다. 3. 필요한 API 검색하기 이 포스팅에서는 축산물 이력정보를 검색하고 신청해보겠습니다. 이 글을 보시는 분들께서는 희망하는 API를 검색하시기 바랍니다. 검색하면 나오는 페이지에 있는 목록 중에 오픈 API항목에서 희망하는 API..
이 글은 아래링크의 강의를 보고 공부했던 내용을 정리한 내용입니다. 내용은 아직 공부 초반이라 많이 부족합니다. 공부하면서 점점 보완하여 업데이트 하도록 하겠습니다. 딥러닝 입문에서 활용까지 케라스(Keras) | T아카데미 온라인강의 1. 딥러닝 레이어(Layer)에 대한 개념을 '블록'에 비유하여 설명한다. 2. 케라스를 이용한 MLP, CNN, RNN, GAN 모델링 방법에 대해 알아본다. tacademy.skplanet.com Model을 구성하는 Network, Objective Function, Optimizer Model을 크게 3가지로 나누어 본다면 Network / Objective Function / Optimizer 3가지로 볼 수 있습니다 이 세가지를 레고 사람 블럭 에 비유하면 N..
애플이 플러그인 사용을 권장하지 않으면서 Adobe Flash Player로 구성된 페이지는 아래와 같이 보일때가 있을겁니다. control키를 눌러 플러그인 실행을 눌러도 아무런 반응이 없어 정말 답답해 하던 차에 방법을 찾았습니다. 먼저 사파리를 실행하고 왼쪽 상단바에 Safari라고 써있는 곳을 클릭합니다. 클릭하면 나오는 메뉴에서 환경설정을 눌러줍니다. 웹사이트항목에서 왼쪽 메뉴 맨아래로 스크롤한 뒤 Adobe Flash Player에 체크하여 활성화 하고 현재 열려있는 웹사이트에서 Adobe Flash Player를 허용해줄 사이트 설정을 끔 -> 켬으로 변경해주시면 됩니다. 그럼 이상없이 잘 실행되는 것을 볼 수 있습니다. 위 글은 아래의 링크에서 정보를 얻어 만들었습니다. Mac용 Safar..
1. 제어판을 활용한 접근 작업표시줄의 돋보기 모양을 눌러 제어판을 눌러 실행합니다. 제어판에서 시스템 및 보안을 눌러줍니다. 시스템을 눌러줍니다. 고급 시스템 설정으로 들어가 환경변수를 눌러줍니다. 2. 단축키를 활용한 빠른 접근 Windows + R 버튼을 입력하여 실행창이 열리면 sysdm.cpl ,3 을 입력해주고 확인을 누르면 시스템 속성 창이 나옵니다. 여기서 sysdm.cpl^,3 sysdm.cpl하고 한칸 띄어쓴 다음 ,3 입력입니다. 여기서 환경변수 버튼을 클릭하면 접근할 수 있습니다.
1. 설치파일 다운로드 받기 Download Center: Community Server Download MongoDB Community Server, the most popular non-relational database built to address the needs of modern applications. www.mongodb.com 먼저 위의 링크로 접속합니다. Version 4.2.0 (current release) OS Windows x64 x64 Package MSI 선택하고 Download를 눌러 설치 파일을 다운로드 받습니다. 2. 설치하기 다운로드 받은 msi 설치파일을 실행합니다. I accept the terms in the License Agreement에 체크를해서 동의해주고..
요즘 멀티캠퍼스에서 자연어처리에 대한 교육을 받으며 사용했던 은전한닢 프로젝트 라이브러리인 Mecab-ko-dic을 Google Colab에서 간단한 몇가지 명령어를 통하여 설치하고 사용할 수 있도록 Shell Script를 작성해 보았습니다. Google Colab은 외부라이브러리의 영구적인 설치가 어려워 항상 다시 설치해주어야하여 쉽게 설치해보고자 만들어 보았습니다. 아이디어를 주신 복종순 강사님께 감사드립니다. 처음 만들어보는거라 Shell Script라 많이 미숙합니다. 보시고 부족한 점이나 수정해야할 점 들을 가감없이 알려주시면 감사하겠습니다. Shell Script실행 시 mecab-0.996-ko-0.9.2 mecab-ko-dic-2.1.1-20180720 가 설치됩니다. 2022년 1월 9..
mecab-ko-dic은 오픈 소스 형태소 분석 엔진인 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다. 말뭉치 학습과 사전 목록은 모두 21세기 세종계획의 성과물을 사용하였다고 합니다. 자세한 내용은 아래의 페이지에서 볼 수 있습니다. Bitbucket bitbucket.org 다음은 설치 과정입니다. 설치 환경은 Windows 10의 VirtualBox 가상머신에 설치되어있는 Ubuntu 18.04 LTS입니다. 설치 전 자바가 설치되어있는지 확인해보고 설치가 되어있지 않다면 JAVA를 먼저 설치하기 바랍니다. [Ubuntu]OpenJDK설치하기 먼저 apt-get을 Update해줍니다. $ sudo apt-get update 그 다음 OpenJDK를 설치합니다. $ sudo a..
먼저 apt-get을 Update해줍니다. $ sudo apt-get update 그 다음 OpenJDK를 설치합니다. $ sudo apt-get install openjdk-8-jdk Y 를입력하여 계속 진행합니다. 설치가 완료되었으면 $ java -version 명령어로 잘 설치가 완료되었는지 확인합니다. 위와 같이 나온다면 설치완료입니다.