의존 구문분석을 위한 한국어 의존관계 가이드라인 및 엑소브레인 언어분석 말뭉치

Korean Dependency Guidelines for Dependency Parsing and Exo-Brain Language Analysis Corpus

  • 임준호 (한국전자통신연구원 지식마이닝연구실) ;
  • 배용진 (한국전자통신연구원 지식마이닝연구실) ;
  • 김현기 (한국전자통신연구원 지식마이닝연구실) ;
  • 김윤정 (울산대학교 국어국문학과) ;
  • 이규철 (충남대학교 컴퓨터공학과)
  • 발행 : 2015.10.17

초록

2000년대 중반 세종 구구조 구문분석 말뭉치가 배포된 이후 의존 구문분석이 구문분석 연구의 주요 흐름으로 자리 잡으면서 많은 연구자들이 구구조 구문분석 말뭉치를 개별적으로 의존구조로 변환하여 구문분석 연구를 수행하였다. 하지만 한국어 문장의 의존구조 표현에 대한 논의가 부족하여 서로 다른 의존구조로 변환 후 구문분석을 연구함으로써 연구 효율성이 저하되는 문제가 발생하였다 본 연구에서는 이와 같은 문제에 접근하기 위하여 한국어 문장에 대한 의존관계 가이드라인을 제안한다. 그리고 제안하는 가이드라인을 기반으로 구축한 엑소브레인 언어분석 말뭉치(725 문장)에 대해 소개한다.

키워드

과제정보

연구 과제번호 : 휴먼 지식증강 서비스를 위한 지능 진화형 WiseQA 플랫폼 기술 개발

연구 과제 주관 기관 : 정보통신기술진흥센터