Evaluation of the Discordance between Sentence Polarities and Keyword Polarities by Using MUSE Sentiment-Annotated Corpora

MUSE 감성주석코퍼스를 활용한 문장 극성과 키워드 극성간의 불일치 현상에 대한 분석

  • Cho, Donghee (DICORA Department of Linguistics and Cognitive Science, Hankuk University of Foreign Studies) ;
  • Shin, Donghyok (DICORA Department of Linguistics and Cognitive Science, Hankuk University of Foreign Studies) ;
  • Joo, Heejin (DICORA Department of Linguistics and Cognitive Science, Hankuk University of Foreign Studies) ;
  • Chae, Byoungyeol (DICORA Department of Linguistics and Cognitive Science, Hankuk University of Foreign Studies) ;
  • Cao, Wenkai (DICORA Department of Linguistics and Cognitive Science, Hankuk University of Foreign Studies) ;
  • Nam, Jeesun (DICORA Department of Linguistics and Cognitive Science, Hankuk University of Foreign Studies)
  • 조동희 (한국외국어대학교 언어인지과학과 DICORA) ;
  • 신동혁 (한국외국어대학교 언어인지과학과 DICORA) ;
  • 주희진 (한국외국어대학교 언어인지과학과 DICORA) ;
  • 채병열 (한국외국어대학교 언어인지과학과 DICORA) ;
  • 자오 원카이 (한국외국어대학교 언어인지과학과 DICORA) ;
  • 남지순 (한국외국어대학교 언어인지과학과 DICORA)
  • Published : 2016.10.07

Abstract

본 연구는 MUSE 감성 코퍼스를 활용하여 문장의 극성과 키워드의 극성이 얼마만큼 일치하고 일치하지 않은지를 분석함으로써 특히 문장의 극성과 키워드의 극성이 불일치하는 유형에 대한 연구의 필요성을 역설하고자 한다. 본 연구를 위하여 DICORA에서 구축한 MUSE 감성주석코퍼스 가운데 IT 리뷰글 도메인으로부터 긍정 1,257문장, 부정 1,935문장을, 맛집 리뷰글 도메인으로부터는 긍정 2,418문장, 부정 432문장을 추출하였다. UNITEX를 이용하여 LGG를 구축한 후 이를 위의 코퍼스에 적용하여 나타난 양상을 살펴 본 결과, 긍 부정 문장에서 반대 극성의 키워드가 실현된 경우는 두 도메인에서 약 4~16%의 비율로 나타났으며, 단일 키워드가 아닌 구나 문장 차원으로 극성이 표현된 경우는 두 도메인에서 약 25~40%의 비교적 높은 비율로 나타났음을 확인하였다. 이를 통해 키워드의 극성에 의존하기 보다는 문장과 키워드의 극성이 일치하지 않는 경우들, 가령 문장 전체의 극성을 전환시키는 극성전환장치(PSD)가 실현된 유형이나 문장 내 극성 어휘가 존재하지 않지만 구 또는 문장 차원의 극성이 표현되는 유형들에 대한 유의미한 연구가 수행되어야 비로소 신뢰할만한 오피니언 자동 분류 시스템의 구현이 가능하다는 것을 알 수 있다.

Keywords