A Measurement of Lexical Relationship for Concept Network Based on Semantic Features

의미속성 기반의 개념망을 위한 어휘 연관도 측정

  • Ock, Eun-Joo (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Lee, Wang-Woo (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Lee, Soo-Dong (Dept. of Computer Engineering and Information Technology, University of Ulsan) ;
  • Ock, Cheol-Young (Dept. of Computer Engineering and Information Technology, University of Ulsan)
  • 옥은주 (울산대학교 컴퓨터정보통신공학부) ;
  • 이왕우 (울산대학교 컴퓨터정보통신공학부) ;
  • 이수동 (울산대학교 컴퓨터정보통신공학부) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학부)
  • Published : 2001.10.12

Abstract

본 논문에서는 개념망 구축을 위해 사전 뜻풀이말에서 추출 가능한 의미속성의 분포 정보를 기반으로 어휘 연관도를 측정하고자 한다. 먼저 112,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미속성을 추출한다. 추출 가능한 의미속성은 체언류, 부사류, 용언류 등이 있는데 본 논문에서는 일차적으로 명사류와 수식 관계에 있는 용언류 중 관형형 전성어미('ㄴ/은/는')가 부착된 것을 대상으로 한다. 추출된 공기쌍 45,000여 개를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(MI)을 이용하여 명사류와 용언류의 연관도를 측정한다. 한편, 자료의 희귀성을 완화하기 위해 수식 관계의 명사류와 용언류는 기초어휘를 중심으로 유사어 집합으로 묶어서 작업을 하였다. 이러한 의미속성의 분포 정보를 통해 측정된 어휘 연관도는 의미속성의 공유 정도를 계산하여 개념들간에 계층구조를 구축하는 데 이용할 수 있다.

Keywords