일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 데이콘
- 편스토랑
- 맥북
- Baekjoon
- Docker
- 캐치카페
- hackerrank
- 파이썬
- ubuntu
- 편스토랑 우승상품
- PYTHON
- 더현대서울 맛집
- 우분투
- Real or Not? NLP with Disaster Tweets
- SW Expert Academy
- 코로나19
- github
- leetcode
- ChatGPT
- 프로그래머스
- 프로그래머스 파이썬
- dacon
- 자연어처리
- programmers
- AI 경진대회
- Git
- 금융문자분석경진대회
- Kaggle
- 백준
- gs25
- Today
- Total
목록
반응형
2020/03/08 (3)
솜씨좋은장씨
며칠 전 Google Analytics를 설치하고 3일째 티스토리 블로그의 방문 통계와 비교해보면서 두 결과가 정말 많이 다른 것을 알 수 있었습니다. Google Analytics를 설치하면서 같은 기능을 제공하는 네이버의 Naver Analytics를 알게되었고 Naver Analytics의 기능을 살펴보던 중 지역 쪽으로 더 자세한 내용을 제공해주는 것 같아 앞으로 차근차근 열심히 꾸며 각종 책, 맛집, 음식, 영화, 아르바이트 리뷰를 올리고자 개설준비중인 블로그에 적용하면 도움이 많이 될 것 같아 먼저 이 블로그에 설치하여 Google Analytics와는 어떤 점이 다른지 앞으로 어떻게 활용하면 좋을지 알아보고자 적용해보게 되었습니다. 솜씨좋은장씨의 일상이야기 somjang-yolo.tistor..
Kaggle 도전 11일차! 오늘은 어제 데이터 전처리했던 방식에서 조금 더 추가하여 전처리를 진행하고 학습 시킨 후 결과를 도출하여 제출해보았습니다. 먼저 추가로 어떤 데이터를 어떻게 전처리할지 보기위해서 워드클라우드도 그려보고 단어의 빈도수도 확인해보았습니다. 먼저 저번주에 워드클라우드를 그렸던 방법에서 길이가 3이상인 단어와 nltk의 불용어에 없는 단어만 남겨놓고 그려보았습니다. (이 글을 쓰면서 정말 큰 실수했다고 생각되는 부분은 stemmer.stem(word)하기 전에 불용어 처리를 했어야했는데 이미 stemming이 완료된 이후에 불용어 처리를 하다보니 the가 thi로 바뀌는 등 제대로 불용어 처리가 되지 않았던 것 같습니다.) word_list = word_tokenize(clear_t..
Lilah has a string, s, of lowercase English letters that she repeated infinitely many times. Given an integer, n, find and print the number of letter a's in the first n letters of Lilah's infinite string. For example, if the string s = 'abcac' and n = 10, the substring we consider is abcacabcac, the first 10 characters of her infinite string. There are 4 occurrences of a in the substring. Functi..