Notice
Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
Tags
- dacon
- gs25
- 백준
- 편스토랑
- 편스토랑 우승상품
- AI 경진대회
- SW Expert Academy
- 파이썬
- leetcode
- 더현대서울 맛집
- Docker
- Git
- 금융문자분석경진대회
- 프로그래머스 파이썬
- 프로그래머스
- 코로나19
- 캐치카페
- programmers
- PYTHON
- github
- Real or Not? NLP with Disaster Tweets
- 자연어처리
- hackerrank
- 데이콘
- Baekjoon
- 우분투
- ubuntu
- Kaggle
- ChatGPT
- 맥북
Archives
- Today
- Total
목록
반응형
네이버 영화 크롤링 (1)
반응형
솜씨좋은장씨
[Python]네이버 영화 데이터 크롤링하기
과거의 영화 줄거리, 평점, 장르 데이터를 가지고 새로운 영화의 평점을 예측하는 모델을 만들 때 학습데이터로 사용하기 위한 데이터들을 크롤링해오기 위한 코드를 짜 보았습니다. 데이터를 수집하기 위한 크롤러를 제작하는데에는 Selenium, BeautifulSoup 그리고 requests를 사용했습니다. 네이버 영화에서 데이터를 수집해오기는 해야하나 순차적으로 데이터를 가져올 수 있도록 링크를 어디서 가져올까 고민하던 중 네이버 시리즈에 18812개의 영화 링크가 있는 페이지를 찾았습니다. 저는 이 페이지에서 판매순으로 가져오기로 했습니다. from bs4 import BeautifulSoup import requests from selenium import webdriver as wd from selen..
Programming/Python
2019. 9. 27. 01:02
반응형