An AutoEncoder Model based on Attention and Inverse Document Frequency for Classification of Creativity in Essay

에세이의 창의성 분류를 위한 어텐션과 역문서 빈도 기반의 자기부호화기 모델

  • Se-Jin Jeong (Department of Software Science and Engineering, Kunsan National University) ;
  • Deok-gi Kim (Department of Software Science and Engineering, Kunsan National University) ;
  • Byung-Won On (Department of Software Science and Engineering, Kunsan National University)
  • 정세진 (군산대학교, 소프트웨어학과) ;
  • 김덕기 (군산대학교, 소프트웨어학과) ;
  • 온병원 (군산대학교, 소프트웨어학과)
  • Published : 2022.10.18

Abstract

에세이의 창의성을 자동으로 분류하는 기존의 주요 연구는 말뭉치에서 빈번하게 등장하지 않는 단어에 초점을 맞추어 기계학습을 수행한다. 그러나 이러한 연구는 에세이의 주제와 상관없이 단순히 참신한 단어가 많아 창의적으로 분류되는 문제점이 발생한다. 본 논문에서는 어텐션(Attention)과 역문서 빈도(Inverse Document Frequency; IDF)를 이용하여 에세이 내용 전달에 있어 중요하면서 참신한 단어에 높은 가중치를 두는 문맥 벡터를 구하고, 자기부호화기(AutoEncoder) 모델을 사용하여 문맥 벡터들로부터 창의적인 에세이와 창의적이지 않은 에세이의 특징 벡터를 추출한다. 그리고 시험 단계에서 새로운 에세이의 특징 벡터와 비교하여 그 에세이가 창의적인지 아닌지 분류하는 딥러닝 모델을 제안한다. 실험 결과에 따르면 제안 방안은 기존 방안에 비해 높은 정확도를 보인다. 구체적으로 제안 방안의 평균 정확도는 92%였고 기존의 주요 방안보다 9%의 정확도 향상을 보였다.

Keywords

Acknowledgement

이 논문은 2022년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(NRF-2022R1A2C1011404).