Korean Zero Anaphora Resolution Guidelines

한국어 생략어복원 가이드라인

  • Ryu, Jihee (Electronics and Telecommunications Research Institute) ;
  • Lim, Joon-Ho (Electronics and Telecommunications Research Institute) ;
  • Lim, Soojong (Electronics and Telecommunications Research Institute) ;
  • Kim, Hyunki (Electronics and Telecommunications Research Institute)
  • 류지희 (한국전자통신연구원 언어지능연구그룹) ;
  • 임준호 (한국전자통신연구원 언어지능연구그룹) ;
  • 임수종 (한국전자통신연구원 언어지능연구그룹) ;
  • 김현기 (한국전자통신연구원 언어지능연구그룹)
  • Published : 2017.10.13

Abstract

말과 글에서 유추가 가능한 정보에 대해서는 사람들이 일반적으로 생략해서 표현하는 경우를 볼 수 있다. 사람들은 생략된 정보를 문맥적으로 유추하여 이해하는 것이 어렵지 않지만, 컴퓨터의 경우 생략된 정보를 고려하지 못해 주어진 정보를 완전하게 이해하지 못하는 문제를 낳게 된다. 우리는 이러한 문제를 생략어복원을 통해 해결할 수 있다고 여기면서 본 논문을 통해 한국어 생략어복원에 대해 정의하고 기술 개발에 필요한 말뭉치 구축 시의 생략어복원 대상 및 태깅 사례를 포함하는 가이드라인을 제안한다. 또한 본 가이드라인에 의한 말뭉치 구축 및 기술 개발을 통해서 엑소브레인과 같은 한국어 질의응답 시스템의 품질 향상에 기여하는 것이 본 연구의 궁극적인 목적이다.

Keywords