The Construction of Predicate Subcategorization Using Tree Tagged Corpus

구문구조부착 말뭉치를 이용한 술어의 하위범주화 정보 구축

  • Ryu, Pum-Mo (Dept. of Natural Language Information Processing, SERI) ;
  • Jang, Myung-Gil (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Soo-Jun (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Jae-Deuk (Dept. of Natural Language Information Processing, SERI) ;
  • Park, Doing-In (Dept. of Natural Language Information Processing, SERI)
  • 류법모 (시스템공학연구소 자연어정보처리연구부) ;
  • 장명길 (시스템공학연구소 자연어정보처리연구부) ;
  • 박수준 (시스템공학연구소 자연어정보처리연구부) ;
  • 박재득 (시스템공학연구소 자연어정보처리연구부) ;
  • 박동인 (시스템공학연구소 자연어정보처리연구부)
  • Published : 1997.10.10

Abstract

한국어 문장에서 술어의 역할이 매우 중요하기 때문에 술어의 하위범주화 정보는 한국어 분석 및 생성에서 필수적이다. 그러나 기존의 한국어 술어의 하위범주화 사전은 전문가의 사전지식이나 직관에 의존하여 만들어졌기 때문에 주관적이고 오류의 가능성이 높으며 많은 수작업이 필요했다. 또 영역에 독립적인 하위범주화 정보를 구축하는 작업은 매우 어렵기 때문에 응용영역에 맞는 하위범주화 정보를 쉽게 구축하는 방법이 요구되었다. 본 논문에서는 구문구조부착 말뭉치를 이용하여 전문가의 제한된 개입만으로 통계정보와 명사의 의미정보를 포함하는 술어의 하위범주화 정보 구축 방법을 제안한다.

Keywords