Clustering Noun Using Syntactic Relations

용언의 구문관계를 이용한 명사 분류

  • 김현진 (시스템공학연구소 자연어정보처리연구부) ;
  • 박세영 (한국전자통신연구원 소프트웨어연구부) ;
  • 장명길 (시스템공학연구소 자연어정보처리연구부) ;
  • 박재득 (시스템공학연구소 자연어정보처리연구부) ;
  • 박동인 (시스템공학연구소 자연어정보처리연구부)
  • Published : 1997.10.10

Abstract

자연언어를 처리하는 응용시스템에서는 의미적으로 유사한 집합으로 분류된 단어들을 이용하는 것이 필요하다. 특히 한국어에서는 명사마다 함께 쓰이는 용언들이 제한되어 있다. 이 논문에서는 문장에서 용언과 명사의 구문 관계로 추출되는 정보를 이용하여 명사를 분류하는 방법을 제시한다. 또한 실제 코퍼스에서 추출된 명사들을 중심으로 의미적 집합으로 묶는 작업을 하고, 각 의미군마다 특징적인 구문 정보를 적용하여 자동 명사 추출에서 나타나는 모호성 해소에도 이용하였다. 용언의 구문관계 추출은 기존 연구된 용언 하위 분류 연구를 이용하였고, 코퍼스를 통해 얻은 명사와 용언을 이용하여 수정 및 보완하였다. 실험 코퍼스는 1만 문장 가량의 구문 구조가 부착된 코퍼스(Tree Tagged Corpus)를 이용하였다.

Keywords