통계적 명사패턴 분류를 이용한 복합명사 검색 모델

A Compound Term Retrieval Model Using Statistical Noun-Pattern Categorization

  • 박영찬 (한국과학기술원 전산학과) ;
  • 최기선 (한국과학기술원 전산학과)
  • Park, Young-C. (Dept. of Computer Science Koread Advanced Institute of Science and Technology) ;
  • Choi, Key-Sun (Dept. of Computer Science Koread Advanced Institute of Science and Technology)
  • 발행 : 1996.10.11

초록

복합명사는 한국어에서 가장 빈번하게 나타나는 색인어의 한 형태로서, 영어권 중심의 정보검색 모델로는 다루기가 어려운 언어 현상의 하나이다. 복합명사는 2개 이상의 단일어들의 조합으로 이루어져 있고, 그 형태 또한 여러 가지로 나타나기 때문에 색인과 검색의 큰 문제로 여겨져 왔다. 본 논문에서는 복합명사의 어휘적 정보를 단위명사들의 통계적 행태(statistical behavior)에 기반 하여 자동 획득하고, 이러한 어휘적 정보를 검색에 적용하는 모텔을 제시하고자 한다. 본 방법은 색인시의 복합명사 인식의 어려움과 검색시의 형태의 다양성을 극복하는 모델로서 한국어를 포함한 동양권의 언어적 특징을 고려한 모델이다.

키워드