A Part-of-Speech Tagging Using Fuzzy Network

퍼지망을 이용한 한국어 품사 태깅

  • 김재훈 (한국과학기술원, 전산학과) ;
  • 조정미 (한국과학기술원, 전산학과) ;
  • 김창현 (한국과학기술원, 전산학과) ;
  • 서정연 (한국과학기술원, 전산학과) ;
  • 김길창 (한국과학기술원, 전산학과)
  • Published : 1993.10.08

Abstract

본 논문은 퍼지 망(Fuzzy Network)외 개념을 도입하여 한국어 단어의 품사 태깅에 관한 새로운 모델을 제시하고자 한다. 한국어 단어의 품사 태깅이란 여러 개의 품사를 가진 단어가 한국어 문장 속에 나타났을 때, 단어의 품사를 올바르게 결정하는 것이다. 여기서 가장 기본적인 문제는 여러 가지의 태그를 포함하고 있는 단어들의 나열을 어떻게 퍼지 망으로 표현하는가 하는 문제이다. 본 논문에서는 한국어 품사를 태깅할 때 사용한 퍼지 망을 정점(vertex)으로 단어 품사의 퍼지 집합을 표현하고, 연결선(edge)으로 품사와 품사간의 퍼지관계를 표현한다. 일단 퍼지망으로 표현되면, 퍼지망에서의 최적의 경로를 찾는 문제와 동일하게 풀 수 있다. 일반적으로 퍼지 망에서 최적의 경로를 찾는 문제는 dynamic programming 방법에 의해서 효과적으로 해결할 수 있다. 약 2만 6천개의 형태소를 실험 데이타로 하여 실험한 결과, 전체적인 품사 태깅 정확률은 95.6%로 비교적 좋은 결과를 보였다. 앞으로 좀 더 세분화된 태그 집합과 정확히 태깅된 실험 데이타로부터 추출된 소속함수를 이용한다면, 더 좋은 결과를 기대할 수 있다.

Keywords