DACON 금융문자분석 공모전

Notice

[블로그 업데이트 공지] 코드 블럭 내용 복사⋯

Recent Posts

Recent Comments

Link

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

Today

Total

관리 메뉴

솜씨좋은장씨

DACON 금융문자분석 공모전 - 도전 6일차 본문

DACON/KB 금융문자 분석 경진대회

DACON 금융문자분석 공모전 - 도전 6일차

솜씨좋은장씨 2019. 12. 19. 14:09

728x90

첫번째 제출 (Google Colab -TPU)

오늘은 형태소 분석기에서 morphs 메소드가아닌 nouns 메소드를 사용해보기로 했습니다.

형태소 분석기는 Mecab 메소드는 nouns를 사용하여 전처리한 데이터를 학습시켜 보았습니다.

model3 = Sequential()
model3.add(Embedding(max_words, 100))
model3.add(LSTM(128))
model3.add(Dense(2, activation='sigmoid'))

model3.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
history3 = model3.fit(X_train, y_train, epochs=2, batch_size=32, validation_split=0.1)

epoch	2	batch_size	32
optimizer	adam	validation_split	0.1

첫번째 제출 결과

두번째 제출 (Google Colab -TPU)

이번에는 순환 컨볼루션 모델을 적용해 보았습니다.

형태소 분석기는 Mecab에서 Okt로 메소드도 nouns에서 morphs로 다시 바꾸어 시도해보았습니다.

단어의 길이가 2이상인 단어만 남기고 만든 학습데이터를 학습시켜 보았습니다.

model14 = Sequential()
model14.add(Embedding(max_words, 128, input_length=max_len))
model14.add(Dropout(0.2))
model14.add(Conv1D(256,
                 3,
                 padding='valid',
                 activation='relu',
                 strides=1))
model14.add(GlobalMaxPooling1D())
model14.add(Dense(128, activation='relu'))
model14.add(Dropout(0.2))
model14.add(Dense(2, activation='sigmoid'))
model14.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
history14 = model14.fit(X_train3, y_train3, epochs=2, batch_size=32, validation_split=0.1)

epoch	2	batch_size	32
optimizer	adam	validation_split	0.1

두번째 제출 결과

세번째 제출 (Google Colab -TPU)

이번에는 두번째 제출할때 데이터를 정제하고 학습시켰던 방법에서 형태소 분석기만 Okt에서 Mecab으로 바꾸어 도전해보았습니다.

model15 = Sequential()
model15.add(Embedding(max_words, 128, input_length=max_len))
model15.add(Dropout(0.2))
model15.add(Conv1D(256,
                 3,
                 padding='valid',
                 activation='relu',
                 strides=1))
model15.add(MaxPooling1D(pool_size=4))
model15.add(LSTM(128))
model15.add(Dense(2, activation='sigmoid'))
model15.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
history15 = model15.fit(X_train3, y_train3, epochs=2, batch_size=32, validation_split=0.1)

epoch	2	batch_size	32
optimizer	adam	validation_split	0.1

세번째 제출 결과

순위	점수	epoch / batch	optimizer	val_split	train_data	특수문자제거	colab
1	0.982279102	2 / 32	adam	0.1	model_kb_dacon02_trainset.csv	O	TPU	Okt	14
2	0.974579243	2 / 32	adam	0.1	model_kb_dacon02_trainset.csv	O	TPU	Okt	8
3	0.972980365	2 / 32	adam	0.1	model_kb_dacon02_trainset.csv	O	TPU	Mecab	9
4	0.972850631	3 / 32	adam	0.1	model_kb_dacon02_trainset.csv	O	TPU	Okt	13
5	0.97262973	5 / 32	adam	0.1
6
7	0.972030154	2 / 32	adam	0.1	model_kb_dacon02_trainset.csv	O	TPU	Okt	10
8	0.96873422	5 / 32	adam	0.1	model_kb_dacon01_trainset.csv	X	GPU	Okt	6
9
10
11	0.96549088	5 / 32	rmsprop	X	model_kb_dacon01_trainset.csv	X	TPU	Okt	2
12	0.9608906	5 / 32	adam	X	model_kb_dacon01_trainset.csv	X	TPU	Okt	3
13
14	0.95197054	5 / 32	adam	0.1	model_kb_dacon01_trainset.csv	X	TPU	Mecab	5
15
16
17	0.886882889	2 / 32	adam	0.1	model_kb_dacon02_trainset.csv	O	TPU	Mecab	18
18	0.701388499	3 / 32	adam	X	model_kb_dacon01_trainset.cs	X	GPU	ELMo	7

순위는 전날보다 하나 떨어진 19위가 되었습니다.

앞으로 아직 도전해보지 않은 bi-LSTM 모델이나 한글만 추려서 도전해보려고합니다.

읽어주셔서 감사합니다.

'DACON > KB 금융문자 분석 경진대회' 카테고리의 다른 글

DACON KB 금융문자분석 경진대회 밋업! 참여 후기! (6)	2020.02.21
DACON 금융문자분석 공모전 - 도전 5일차 (0)	2019.12.18
DACON 금융문자분석 공모전 - 도전 4일차 (0)	2019.12.17
DACON 금융문자분석 공모전 - 도전 3일차 (0)	2019.12.16
DACON 금융문자분석 공모전 - 도전 2일차 (0)	2019.12.15