일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 캐치카페
- 맥북
- ChatGPT
- ubuntu
- 편스토랑 우승상품
- github
- gs25
- 우분투
- leetcode
- 프로그래머스
- 프로그래머스 파이썬
- AI 경진대회
- hackerrank
- 더현대서울 맛집
- 백준
- Docker
- programmers
- Baekjoon
- SW Expert Academy
- dacon
- Real or Not? NLP with Disaster Tweets
- 데이콘
- 코로나19
- 편스토랑
- Kaggle
- Git
- 파이썬
- 자연어처리
- PYTHON
- 금융문자분석경진대회
- Today
- Total
솜씨좋은장씨
DACON 원자력 상태판단 알고리즘 경진대회 참여 후기! 본문
idEANS 팀원들과 함께 진행했던 후기입니다.
자세한 내용은 idEANS 팀 블로그에 포스팅 하였습니다.
아래의 링크를 참고해 주시기 바랍니다.
대회 링크
[산업] 원자력발전소 상태 판단 대회
출처 : DACON - Data Science Competition
dacon.io
데이터 불러오기 / 이해하기
제공 데이터 이해하고 학습데이터/테스트 데이터 load 해보기!
라벨링은 어떻게 해야할까? train.zip : 각각의 csv파일은 feature에 대한 내용만 저장되어있음. train_label.csv : 각각의 csv파일에 대한 label 값은 train_label.csv에 저장되어있음. 참가자가 직접 라벨링을..
ideans.tistory.com
도전 1, 2일차
원자력 발전소 상태 판단 알고리즘 공모전 도전 1, 2일차!
다음의 과정은 Google Drive에 데이터를 저장하고 Colab - TPU 환경에서 진행하였습니다. 이 공모전은 원자력 발전소의 5,121개의 변수를 가지고 각각의 label (상태 0~197)에 해당하는 예측확률을 0~1사이의 값으..
ideans.tistory.com
도전 3, 4일차
원자력 발전소 상태 판단 알고리즘 공모전 도전 3,4일차!
그동안 Dev-Matching, Naver AI Burning DAY를 도전하느라 도전 1, 2일차에서 시간이 많이 지났지만 아직 종료일인 12일까지는 시간이 남아 다시 도전을 시작했습니다. 이번에는 Gradient Boosing 중 하나인 Light..
ideans.tistory.com
도전 5일차 (마지막날)
원자력 발전소 상태 판단 알고리즘 공모전 도전 5일차!(마지막날)
먼저 lightGBM 모델을 사용하였습니다. from lightgbm import LGBMClassifier, plot_importance lgb2 = LGBMClassifier(n_estimators=2, learning_rate=0.001, max_depth=7,min_child_samples=48, random_state=43..
ideans.tistory.com
최종 Private 순위
총 190팀 중에 47위를 기록했습니다.
5일 동안 도전 후기
처음 시작할때 머신러닝의 여러 앙상블 모델에 대해서 모르고
그저 DACON에서 제공해주는 base_line 코드의 하이퍼 파라미터만 바꿔보면서 도전했지만
알바도 하고 Dev-Matching을 도전하면서 핸즈온 머신러닝과 패스트 캠퍼스의 머신러닝 강의를 통해
각 알고리즘의 개념과 주로 많이쓰이는 모델, 그리고 보통 성능이 잘나오는 모델이 무엇인지도 알 수 있었습니다.
그 후 속도도 빠르고 성능도 잘나온다는 lightGBM을 사용해 보았지만 결과는 좋지 못하였습니다.
어떻게하면 최적의 파라미터를 찾을 수 있을까!
하고 다시 공부를 하면서 GridSearchCV와 같은 기법에 대해서 알게되었습니다.
Colab 환경에서 여러 하이퍼파라미터를 변수로 넣고 테스트 해보기에는 시간과 자원이 부족함을 느꼈습니다.
조금 더 빨리 공부하고 더 많이 도전해봤으면 어땠을까 하는 생각이 들지만!
이 대회의 수상이 끝난 후 연습으로 지속적으로 제출이 가능하다고하니
시간이 모자라서 더 못했던 내용들을 하나씩 도전해보면서 성능을 높여가볼 생각입니다.
(+ 월간데이콘 2도 수치데이터면 같이 도전해보려합니다.)
성능을 높이는 과정은 개인 블로그에 하나씩 올려보려합니다.
언젠가는 머신러닝/딥러닝용 컴퓨터를 맞추고 런타임 걱정없이 돌릴 그날까지!
열심히 공부하려합니다.
대회는 끝났지만 아직 이 데이터를 가지고 연습을 할 수 있도록 데이터 다운로드와 제출을 할 수 있게 열려있습니다.
이러한 수치 데이터를 다루어 보고 싶은 분들은 한 번 도전해보셔도 좋을 것 같습니다.
읽어주셔서 감사합니다.
나도 한번 도전해보기 ↓
[산업] 원자력발전소 상태 판단 대회
출처 : DACON - Data Science Competition
dacon.io