Quantitative Evaluation of Bags-of-Features Method Using Part-of-Speech Tagging

품사 부착 실험을 통한 Bags-of-Features 방법의 정량적 평가

  • Lee, Chanhee (Department of Computer Science and Engineering, College of Informatics, Korea University) ;
  • Lee, Seolhwa (Department of Computer Science and Engineering, College of Informatics, Korea University) ;
  • Lim, Heuiseok (Department of Computer Science and Engineering, College of Informatics, Korea University)
  • 이찬희 (고려대학교 정보대학 컴퓨터학과) ;
  • 이설화 (고려대학교 정보대학 컴퓨터학과) ;
  • 임희석 (고려대학교 정보대학 컴퓨터학과)
  • Published : 2017.10.13

Abstract

본 논문에서는 단순하지만 효과적인 단어 표현 방법인 Bags of Features에 대한 비교 실험을 수행한다. Bags of Features는 어휘집의 크기에 제한이 없으며, 문자 단위의 정보를 반영하고, 벡터화 과정에서 신경망 구조에 의존하지 않는 단어 표현 방법이다. 영어 품사 부착 실험을 사용하여 실험한 결과, one-hot 인코딩을 사용한 모델과 대비하여 학습 데이터에 존재하지 않는 단어의 경우 49.68%, 전체 부착 정확도는 0.96% 향상이 관찰되었다. 또한, Bags of Features를 사용한 모델은 기존의 영어 품사 부착 분야의 최첨단 모델들 중 학습 데이터 외의 추가적인 데이터를 활용하지 않는 모델들과 비견할 만한 성능을 보였다.

Keywords