관리 메뉴

솜씨좋은장씨

[Kaggle DAY18]Real or Not? NLP with Disaster Tweets! 본문

Kaggle/Real or Not? NLP with Disaster Tweets

[Kaggle DAY18]Real or Not? NLP with Disaster Tweets!

솜씨좋은장씨 2020. 3. 15. 16:49
728x90
반응형
clear_text_list = list(test['clear_text'])

X_test = []
for clear_text in clear_text_list:
  word_list = word_tokenize(clear_text)
  word_list = [word for word in word_list if len(word) > 2]
  word_list = [word for word in word_list if word not in stop_words]
  # word_list = [stemmer.stem(word) for word in word_list]
  word_list = [lemmatizer.lemmatize(word) for word in word_list]
  X_test.append(word_list)
X_test[:3]

Kaggle 도전 18회차!

오늘은 아르바이트로 시간이 없기에

지난 17회차에 결과 도출시 사용하는 데이터를 전처리하는 과정에서

word_list = [lemmatizer.lemmatize(word) for word in word_list]

이 과정을 빼먹었던 것을 제대로 넣어 다시 제출해보았습니다.

Comments