Applying Universal Dependency Relation Tagsets to Korean

Universal Dependency 관계 태그셋의 한국어 적용

  • Lee, Chanyoung (Department of Korean Language and Literature, Yonsei University) ;
  • Kim, Jinung (Yonsei Institute of Language and Information Studies) ;
  • Kim, Han Saem (Yonsei Institute of Language and Information Studies)
  • 이찬영 (연세대학교 국어국문학과) ;
  • 김진웅 (연세대학교 언어정보연구원) ;
  • 김한샘 (연세대학교 언어정보연구원)
  • Published : 2018.10.12

Abstract

본 논문에서는 기존에 구축되어 있는 구 구조 기반 구문 분석 태그셋을 Universal Dependency 관계 태그 셋으로 변환하는 방안에 대해 논의하였다. 범언어적으로 활용하기 위해 개발된 Universal Dependency의 관계 태그셋을 한국어에 적용할 때에는 범용 POS 태그셋인 UPOS뿐만 아니라 개별 언어의 특성을 반영하고 있는 XPOS를 반드시 참고해야만 한다. 본 연구에서는 Universal Dependency 관계 태그셋을 한국어 구문 분석 태그셋에 대응시키는 과정에서 생기는 문제점들을 '원시 말뭉치 처리 문제'와 '기구축 구문 태그 말뭉치 오류의 문제'로 나누어 지적하고, 이에 대한 해결책을 제시하였다.

Keywords