한국어 문법검사기에서 의미정보를 이용한 복합명사의 분석제약

To Constrain Korean Compound Nouns using Semantic Information for Korean Grammar Checker

  • 원상연 (부산대학교 전자계산학과) ;
  • 김수남 (부산대학교 전자계산학과) ;
  • 김광영 (부산대학교 전자계산학과) ;
  • 남현숙 (부산대학교 전자계산학과) ;
  • 권혁철 (부산대학교 정보.컴퓨터공학부)
  • Won, Sang-Yun (Department of Computer Science, Pusan National University) ;
  • Kim, Su-Nam (Department of Computer Science, Pusan National University) ;
  • Kim, Kwang-Young (Department of Computer Science, Pusan National University) ;
  • Nam, Hyun-Suk (Department of Computer Science, Pusan National University) ;
  • Kwon, Hyuk-Chul (Division of Information and Computer Engineering, Pusan National University)
  • 발행 : 1999.10.08

초록

일반적으로 두 개의 명사가 결합하여 하나의 명사 기능을 하는 어구를 복합명사라고 한다. 한국어는 복합명사 내의 명사를 붙여볼 수도 있고 띄어쓸 수도 있으므로 복합명사의 형태적 분석에 많은 어려움이 있다. 이 연구에서는 각 명사의 복합명사 결합을 최대한 제약하여 문법검사기에서 복합명사와 관련된 오류의 발생을 최소화할 수 있는 방범을 개발했다. 이 논문에서 복합명사 분석 기능을 제약하는 방법으로 형태적 제약 방법과 의미정보에 따라 복합명사의 결합관계를 제약하는 방법을 이용했다. 어휘 정보만으로 복합명사를 분석하면 의미관계에 의한 오류는 찾기 어려우므로 복합명사의 구조적 결합관계와 의미 결합관계를 밝혀 복합명사를 잘못 분석하는 문제점을 극복한다. 복합명사의 결합제약은 명사의 왼쪽과 오른쪽에 올 수 있거나 올 수 없는 명사를 의미, 형태적 특성과 명사가 나타나는 분포(distribution)에 따라 분류하여 규칙베이스화하였다. 의미정보를 이용한 복합명사 결합제약 알고리즘도 구현하였다.

키워드