일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- ubuntu
- AI 경진대회
- ChatGPT
- 금융문자분석경진대회
- hackerrank
- leetcode
- 프로그래머스
- 캐치카페
- Kaggle
- 파이썬
- SW Expert Academy
- 편스토랑
- Baekjoon
- 데이콘
- gs25
- 백준
- programmers
- 자연어처리
- 편스토랑 우승상품
- PYTHON
- Docker
- 더현대서울 맛집
- Real or Not? NLP with Disaster Tweets
- 코로나19
- Git
- 우분투
- dacon
- github
- 프로그래머스 파이썬
- 맥북
- Today
- Total
목록
반응형
python pandas (2)
솜씨좋은장씨
🧑🏻💻 겪었던 일 최근 회사에서 기존 고객사의 DB에 있는 정보를 기존 솔루션에 반영하는 작업을 진행하면서 csv 형식의 덤프파일로 만들어진 기존 DB의 정보를 솔루션에 반영하는 과정이 있었습니다. 솔루션에 모든 데이터가 별다른 에러가 없이 잘 들어가는 것을 확인하여 에러가 없나보다 하던 차에 기존 DB 데이터의 Contents ID 와 솔루션에 반영된 같은 데이터의 Contents ID 가 다른 것을 발견하였습니다. 기존 DB 데이터의 Contents ID 가 '0132323' 이었다면 솔루션에 반영된 같은 데이터의 Contents ID가 '132323' 으로 맨 앞의 0이 제거된 채로 반영이 되어있었습니다. 🧑🏻💻 원인 원인이 무엇일까 하고 찾다보니 덤프파일로 내려진 csv 파일을 읽을때 pand..
오늘 친구의 부탁으로 날짜별 특정 키워드에 대한 네이버 뉴스 크롤링을 진행하였는데 각 날짜별로 만들어진 이 모든 엑셀 파일을 하나의 엑셀로 만들어서 전달해야하여 pandas를 활용해서 작업해보았습니다. 추후 또 사용할 일이 있을 것 같아 적어보려 합니다. ( 전체 코드는 맨 마지막에 있습니다. ) 1. 병합을 원하는 엑셀파일 목록 가져오기 1-1. os.listdir을 이용하는 방법 import os file_format = "파일 포맷(확장자)" # .csv .xlsx file_path = "파일 경로" file_list = [f"{file_format}/{file}" for file in os.listdir(file_path) if file_format in file] 위의 사진의 엑셀 파일을 예시로..