Extending Korean PropBank for Korean Semantic Role Labeling and Applying Domain Adaptation Technique

한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용

  • Bae, JangSeong (Dept. of computer science, Kangwon National University) ;
  • Oh, JunHo (Dept. of computer science, Kangwon National University) ;
  • Hwang, HyunSun (Dept. of computer science, Kangwon National University) ;
  • Lee, Changki (Dept. of computer science, Kangwon National University)
  • 배장성 (강원대학교 컴퓨터과학과) ;
  • 오준호 (강원대학교 컴퓨터과학과) ;
  • 황현선 (강원대학교 컴퓨터과학과) ;
  • 이창기 (강원대학교 컴퓨터과학과)
  • Published : 2014.10.07

Abstract

한국어 의미역 결정(Semantic Role Labeling)은 주로 기계 학습에 의해 이루어지며 많은 말뭉치 자원을 필요로 한다. 그러나 한국어 의미역 결정 시스템에서 사용되는 Korean PropBank는 의미역 부착 말뭉치와 동사 격틀이 영어 PropBank의 1/8 수준에 불과하다. 따라서 본 논문에서는 한국어 의미역 결정 시스템을 위해 의미역 부착 말뭉치와 동사 격틀을 확장하여 Korean PropBank를 확장 시키고자 한다. 의미역 부착 말뭉치를 만드는 일은 많은 자원과 시간이 소비되는 작업이다. 본 논문에서는 도메인 적응 기술을 적용해보고 기존의 학습 데이터를 활용하여, 적은 양의 새로운 학습 말뭉치만을 가지고 성능 하락을 최소화 할 수 있는지 실험을 통해 알아보고자 한다.

Keywords