한국어 의미 표지 부착 말뭉치 구축 작업

Korean Semantic Tagged Corpus Construction working

  • 이민지 (한림대학교 유비쿼터스 게임공학과) ;
  • 이윤정 (한림대학교 유비쿼터스 게임공학과) ;
  • 이정국 (한림대학교 컴퓨터공학과) ;
  • 김종대 (한림대학교 유비쿼터스 컴퓨팅학과) ;
  • 박찬영 (한림대학교 유비쿼터스 컴퓨팅학과) ;
  • 송혜정 (한림대학교 유비쿼터스 컴퓨팅학과) ;
  • 김유섭 (한림대학교 유비쿼터스 컴퓨팅학과)
  • 발행 : 2012.10.06

초록

의미 역 결정 (Semantic Role Labeling)은 문장 내의 술어-논항 요소들의 의미 관계를 결정하는 과정이다. 이를 위해서는 의미 표지 부착 말뭉치가 필요하지만 한국어의 경우 이 데이터가 매우 부족한 상황이다. 본 논문에서는 한국어 Proposition Bank(이하 PropBank) 말뭉치와 세종 용언 격틀 말뭉치 구축을 위한 의미 표지 부착 작업에 대해 설명한다. 표지 부착 작업은 말뭉치의 의존 관계를 사람이 파악하여 적절한 의미 역 태그를 다는 과정이고, 이 과정으로부터 얻은 말뭉치는 의미 역 결정을 위한 기계 학습 방법론의 훈련 자료로 이용된다. 이 과정에서 필요한 구문 표지 부착 밀뭉치로는 한국전자통신연구원의 구문표지 부착 말뭉치를, 그리고 언어자원으로는 한국어 PropBank의 frame file과 세종 용언 격틀 사전을 사용한다.

키워드