일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 자연어처리
- leetcode
- hackerrank
- ubuntu
- 우분투
- ChatGPT
- dacon
- github
- 파이썬
- 금융문자분석경진대회
- 편스토랑 우승상품
- 맥북
- Git
- gs25
- 캐치카페
- AI 경진대회
- Docker
- Real or Not? NLP with Disaster Tweets
- 편스토랑
- 백준
- 데이콘
- 프로그래머스 파이썬
- Baekjoon
- 코로나19
- SW Expert Academy
- PYTHON
- programmers
- 프로그래머스
- Kaggle
- 더현대서울 맛집
- Today
- Total
목록
반응형
2020/03/05 (3)
솜씨좋은장씨
Kaggle 도전 8회차! 오늘은 결과가 가장 좋았던 7회차 모델에 데이터 전처리 방식을 달리하여 제출해보았습니다. 데이터 전처리는 https://~~ 를 정규식을 활용하여 LINK로 변경하여 넣어주었습니다. from tqdm import tqdm import re text_list = list(train_data['text']) clear_text_list = [] for i in tqdm(range(len(text_list))): clear_text = text_list[i].lower() pattern = '(http|ftp|https)://(?:[-\w.]|(?:%[\da-fA-F]{2}))+/(?:[-\w.]|(?:%[\da-fA-F]{2}))+' clear_text = re.sub(patter..
2020년! 프로그래머스에서 자연어처리 여러 회사들과 연계하여 자연어처리 개발자를 채용하는 Dev-Matching 챌린지가 열렸습니다. 마침 멀티캠퍼스 자연어처리 과정을 마치고 쿠팡 상차 아르바이트를 하며 취업을 준비하고 있던 저에게 열정을 불태울 만한 기회가 생겼습니다. 이 Dev-Matching은 11개 회사 중에서 5개 회사 서류 접수 -> 사전 과제 -> 코딩테스트 ( 과제 통과 인원들 ) -> 지원한 회사 중 합격한 회사 면접 순으로 일정이 진행되었습니다. 먼저 서류를 제출하고 과제를 열심히 기다렸습니다. 2월 1일! 드디어 과제가 오픈되었습니다. 과제의 내용은 해시코드라는 개발 관련 질문과 답변이 올라오는 홈페이지의 질문 글을 자동으로 분류할 수 있는 모델을 만드는 것이었습니다. 이 글이 5개..
Given a non-empty array of integers, return the third maximum number in this array. If it does not exist, return the maximum number. The time complexity must be in O(n). Example 1: Input: [3, 2, 1] Output: 1 Explanation: The third maximum is 1. Example 2: Input: [1, 2] Output: 2 Explanation: The third maximum does not exist, so the maximum (2) is returned instead. Example 3: Input: [2, 2, 3, 1] ..